在智能数据的新时代,已被清理、验证、特征化并且能够插入模型并开始快速交付价值的数据,可能性很大。通过配置智能数据,模型可以更快地查找和使用最有影响力的数据,从而了解世界的运作方式并做出更好的决策。充分利用智能数据的企业可能是那些摆脱了大数据思维方式的公司。
我们如何陷入大数据淹没?
数十年来,企业一直在向数据源投入资金,并将更多的信息注入其数据湖。但是,新数据并不总是等同于新的智能(对于机器学习模型,尤其是对核心业务战略),慢慢地,所有这些数据的权重就逐渐建立起来。
由于大多数数据源都需要清理和标准化,因此聘请一个拥有多个研究生学位的昂贵员工,其通常也会在一周的大部分时间里花时间整理基础数据。当将近90%的数据科学项目从未投入生产时,再加上产生有用的机器学习模型的复杂性,就意味着大量的数据科学投资并没有取得重大收益。
2020年进入大流行时代。当财务团队对所有事务运行精细化管理时,必须做好任何准备。正确的数据项目决定成功与否,但是任何不能用于改善核心功能的东西(例如需求预测、定价或提高竞争优势)都是没有道理的。数据更好的时代已经过去,现在是进入智能数据新时代的时候了。
大规模聚合和使用数据仅仅是开始
最重要的部分是获取价值。您现在如何让数据达到目标?最近10年的分析瘫痪状态已经结束。
大数据策略一直试图使数据海洋沸腾已久。这些极简主义方法行不通,因为它们太难了。他们从来没有做过,当您的团队成员较少,利润更紧且您的需求预测依赖于过去的数据时,他们肯定不会这样做。从我所看到的情况来看,现在最好的企业正在将注意力集中在数据湖的深度和广度上,而更多地从中获得最大的价值。
现在是时候将我们的数据策略从瘫痪状态转变为启用状态了,以获取资产并将其转化为可以从中获取价值的东西。现在,让您的数据科学家自由地完成他们梦寐以求的工作:不收集、汇总和清理数据,而是构建模型以利用大数据来进行诸如劳动力优化和价格预测之类的核心流程。
麦肯锡的首席数据官和该公司的一位合作伙伴在2月的一篇文章中很好地指出:“许多公司在收集和利用其自身活动中的数据方面取得了长足的进步。尽管如此,到目前为止,很少有人意识到链接的全部潜力内部数据以及由第三方、供应商或公共数据源提供的数据。忽略此类外部数据是错失的机会。… COVID-19危机提供了一个示例,说明在短短几个月内外部数据的相关性、消费者的购买习惯、活动和数字行为发生了巨大的变化,使先前存在的消费者研究,预测和预测模型过时了;此外,随着组织争先恐后地了解这些不断变化的模式,他们发现内部数据很少使用。外部数据可以而且仍然可以帮助组织进行细粒度的计划和响应。”