此内容是基本指南的一部分: 构建大数据策略
消息 了解最新的企业技术新闻和产品更新。

IT、BI专业人士分享他们的“大数据”分析成功秘诀

根据IT专业人士的说法,为指数增长做计划和让业务用户尽早参与是成功的“大数据”分析计划的两个关键。

发起成功“大数据根据IT专业人士的说法,分析活动需要大量的系统规划、充分的业务用户参与和定义良好的部署策略,这些IT专业人士有处理用于支持分析过程的大型和复杂数据安装的经验。

只要问问comScore Inc.的首席技术长迈克尔•布朗(Michael Brown)就知道了。这家总部位于弗吉尼亚州雷斯顿(Reston)的公司追踪和衡量互联网用户的行为,并利用所收集的数据为企业客户确定在线市场趋势。

ComScore运行着1000多台服务器,每天分析约8tb的原始数据,最近推出了一个新版本Hadoop开源分布式计算框架,旨在更好地处理不断增加的输入信息,并减少生成和向客户交付市场情报所需的时间。

该公司将在今年年底之前达到在管理层之前拥有卑微的数据的里程碑,棕色表示,棕色,他补充说是指数增长的规划是其中之一成功的钥匙在任何大数据分析项目。

布朗说:“要有长远的想法,要为未来10倍于现在的数据量制定计划,因为如果有什么不同的话,那就是数据增长速度正在迅速增长。”“无论你今天认为什么是大的,未来都会黯然失色。”

同样重要的是要记住,“想得远大”不仅仅意味着为服务器容量的增加做计划。布朗说大数据分析计划还必须确定它们现有的数据中心是否足够大,它们的软件许可证是否足够灵活,以支持预期的未来数据增长。

“确保您运行数字并确定如果数据变得非常大,那么您将从成本的角度下为贵公司做最好的事情,”他说。

让用户对大数据分析计划有发言权

杜科沃斯副总统核心加工副总裁将忘记将从将基于大数据分析系统产生的结果的业务用户从业务用户寻求重要决策的投入。如果用户意识到他们的数据分析和报告要求没有满足,他警告说,他警告说,几乎肯定会导致问题。

“早期涉及商业用户,早在你的过程中,”Duckworth说。“Business users are going to come up with queries that they want to run [or] analyses that they’re going to want to see that you’re not going to consider, and you may need to make changes to your architecture that you didn’t anticipate.”

用于分析大数据的开发系统的过程似乎与构建传统数据仓库架构看起来完全不同。例如,大数据分析计划可能需要Hadoop分布,NOSQL数据库技术和一个高性能的服务器集群提供快速的分析性能,特别是如果它们涉及非结构化数据。

但是,与企业数据仓库相关的许多策略和策略 - 例如采取措施确保高水平的数据质量和系统正常运行时间 - 也适用于商业智能经理Michael Brandt(BI)经理Michael Brandt的大数据分析计划在纽约的Linkshare Corp.

LinkShare为在线广告商和发布者提供多种营销服务,主要集中在搜索引擎营销、客户导向和联盟营销等领域。它还提供近乎实时的功能数据同步和分析功能所以客户可以快速了解在线广告的表现,以及他们是否需要换出更有效的营销信息。

Brandt表示,所有人都告诉,主要来自外部用户的一天,主要来自外部用户,以及请求的要求持续增长。回复它们都要求公司捕获,存储和有效地管理有关互联网点击流和在线消费者行为的大量数据。他指出,在过去的18个月内,公司的数据库表均规模至少增加了至少60%,高达80%。

LinkShare最近推出了一个新的数据仓库设备部署项目,以提高系统带宽和性能,而Brandt表示该公司正在考虑在下一次计划的升级周期内添加Hadoop安装三到四年。

大数据分析团队:金字塔建设者?

他最近在佛罗里达州奥兰多举行的一个关于大数据分析的论坛上发表了讲话。,详细描述了一个“成功金字塔”。他的团队的战略在其数据仓库升级期间使用,建议任何从事大数据倡议的组织遵循同类方法。

Brandt概述的金字塔的第一级专注于确保数据仓库和分析系统正常运行,具有明确定义的服务级别协议和正常运行时间要求。他说,由不稳定系统引起的数据处理工作负载可能导致冗余数据,缺少信息和其他数据质量问题。

第二级涉及确保数据质量水平是他们需要的地方。Brandt说,只需将信息获取到内部用户或外部客户的信息并不好转,说。如果数据质量为“差点”或更差,他可能会最终提出不良决策,他警告说。“我宁愿不给他们任何数据,而不是给予他们不好的数据。”

Brandt的金字塔中心的第三级,以确保信息不仅仅是按时到达商业用户和客户,而是在正确的时间。Brandt说,尽快将数据提供给用户尽快向用户提供数据。例如,财务中的用户可能不需要查看日常金融活动的报告,而Web广告商可能会立即开始报告横幅广告的表现,因此它们可以快速取代表现不佳的展示。

最后是时候专注于金字塔的第四级的速度。Brandt表示,组织应该向自己询问各种与绩效相关的问题,包括,如何快速将大量数据加载到表中?我们如何加速数据转换过程?

当他们达到第五级和第六级时,公司应该已经达到了有效的大数据分析的最低要求。因此,他们可以专注于确保系统是良好的,尽可能容易使用,甚至是一点乐趣。

在LinkShare的案例中,Brandt说“乐趣”将以升级的形式出现,使公司的分析系统对终端用户更具互动性和社会性。“我们认为,从报道的角度来看,这将更多地吸引用户,”他说,但拒绝透露具体细节。

深入了解商业智能战略

搜索数据管理
搜索AWS.
搜索内容管理
搜索甲骨文
搜索树液
搜索SQL.服务器
关闭