科斯敏 - 弗洛里亚

评估 权衡你正在考虑的技术、产品和项目的利弊。

新兴分析工具挑战主导的大数据理念

分析技术,如事物互联网和认知计算意味着我们不能在给定主题上拥有所有数据。那么,这对大数据有何意思?

有一种关于大数据的观点认为,如果数据集足够大,就没有必要使用统计分析方法。这就是所谓的“N =所有”哲学。它说,样本和推理是在浪费时间。我们有所有的数据。让数据说话吧。

虽然n =所有大数据哲学在短短几年前就是革命性的革命性,但它很快就会被宣称为新的和潜在的更有价值的分析方法在线。物联网(IoT)分析和认知计算正在让拥有特定学科的所有数据的概念显得古怪,挑战了人们对大数据的普遍看法,并要求分析专业人士重新评估他们的实践。

2008年的N =所有框架的早期制定 - 大数据时代的曙光。写作有线克里斯·安德森(Chris Anderson)谈到了pb级数据存储在广告和生物学等领域的例子。足够大的数据集意味着研究人员甚至不需要制定问题或假设。数字说明了一切。但当你谈到新兴的分析技术时,事情就不是那么简单了。

物联网排除了拥有所有数据的可能性

什么时候来到IoT.,这项技术本身就不可能拥有所有的数据。它包括持续不断的信息流,每秒钟都在更新。而不是寻求获得关键的大量数据,在这些数据中,回溯性问题的答案变得显而易见,你正在寻找一个信号,将告诉你一些关于那个时刻的事情。

最有效的物联网战略认识到该技术与传统的大数据视角有多么不同。边缘分析已成为一个关键的分析成功成功与物联网。这涉及将网络设备和传感器中的统计算法嵌入在网络的边缘,这些算法计算数据的创建数据,使得丢回集中数据存储的数据以及丢弃的数据是什么数据。在这种情况下,更多的数据只是一个负担。你永远不会想要所有的数据。我们返回使用统计方法来确定要使用的数据。

认知计算提供了不同的挑战

认知计算对占主导地位的大数据哲学提出的挑战有些不同。在认知计算领域——无论我们谈论的是人工智能(AI)还是深度学习——都不可能有足够的数据。算法会随着经验而改进,他们接受的训练越多,表现就越好。

以AlphaGo为例,谷歌的Go-Play AI算法.它首先学会通过摄取人类参与者制作的3000万游戏动作来播放棋法游戏。这是算法的初始培训,但这还不够。然后它播放了数千场比赛,每场比赛都会改善。最终,它改进了它能够击败游戏的每个人类硕士的程度。

但从理论上讲,该算法仍然可以通过不断学习来优化自身。你永远不能说它学会了所有关于玩游戏的知识。这同样适用于其他深度学习练习喜欢语音识别,计算机视觉和自然语言处理。人类 - 对认知计算算法的最接近的模拟 - 继续学习彼此沟通的方法,并在整个寿命中描述它们周围的世界。没有理由认为算法可以获得最佳地执行这些任务所需的所有数据。

重新考虑大数据的时间

曾经有一段时间,N = all大数据哲学被认为是终极价值主张.调查整个数据集的能力似乎提供了提出具体问题和得到具体答案的能力,而不必依赖必然涉及不确定性的统计方法。

但是,越来越多的企业的真正价值和他们在市场中脱颖而出的能力将来自这些新兴的分析趋势。想要保持领先地位的企业将需要重新思考大数据到底是什么。

下一个步骤

医疗保健提供者利用新的大数据时代

为什么在客户分析方面,数据越多越好

大数据的好处尚未涓涓细流到较小的公司

深入挖掘大数据分析

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭