电子帐册:

社交媒体分析应用的生死取决于数据

kreizihorse——Fotolia

管理 学习应用最佳实践并优化您的操作。

社交媒体分析的最佳实践受到隐私法的约束

社交媒体提供了丰富的信息和对消费者行为的洞察,但收集和分析这些数据带有各种各样的隐私陷阱。

社交媒体数据可以通过定位消费者行为、人口统计、人物角色、情感和社会趋势来帮助提高公司的营销投资回报率,但实现这些关键目标的道路充满了潜在的隐私风险。

个人社交媒体简介往往包括个人身份信息和其他敏感数据,因此数据科学家必须了解这些信息他们能用什么不能用什么什么目的。围绕社交媒体数据隐私的问题可能因收集的数据类型和使用方式而异。适用法律法规、社交媒体平台合同、数据主体预期的隐私,用例和组织的价值观,所有这些因素都被纳入收集和使用社会媒体数据的决策中。

“我们问客户三个问题:处理或使用数据的目的是什么?你的法律依据是什么?信息技术研究集团(Info-Tech Research Group)分析师丽塔·佐布里格(Rita Zurbrigg)说。

并不是所有的社交媒体数据都同样有用,所以不应该像收集或使用它们一样。

“了解什么样的数据符合深度保护至关重要,”北卡罗来纳州卡里的数据科学和分析公司Cognetik的数据管理和架构副总裁基兰·斯里瓦塔夫(Kiran Sreewastav)说“(了解)敏感数据和个人数据的不同层次很重要,然后围绕这一点建立你的实践。”

浏览灰色区域

Rita Zurbrigg,信息技术研究集团分析师丽塔Zurbrigg

不幸的是,对于社交媒体数据可以使用的问题,没有简单的黑白答案。国际隐私专业人士协会(International Association of Privacy Professionals)副总裁兼首席知识官奥梅尔·特内(Omer Tene)指出:“它的背景非常复杂。”“这取决于地点、适用的法律、平台的背景、规则和数据类型。”

数据从业者不仅需要关注他们收集的数据,还包括数据的主要用途和次要用途,以及数据是从谁那里收集的。

Kiran Sreewastav, cognatik数据管理和架构副总裁Kiran Sreewastav

斯里瓦塔夫解释说:“有很多聚合者在那里搜集社交媒体网站和他们收集的信息,他们转售或购买。“数据会聚集起来,企业就会得到第二手或三手数据,所以你不仅要保护你所获取数据的完整性,你还必须了解你是从谁那里购买数据,以及他们的合规程度。”

Gartner预测,到明年,“个人数据的备份和归档将成为70%的组织面临的最大隐私风险”,而2018年这一比例仅为10%。Gartner说,“在未来两年内在隐私问题上的一份报告中,“组织不修改数据保留策略以减少整体数据,通过扩展的数据备份,将面临一个巨大的不服从处罚风险以及最终的数据泄露所带来的影响。”

监管环境

国家和国际数据保护法律继续激增。剑桥分析公司和Facebook的失败、Equifax被入侵和谷歌未能披露谷歌+漏洞都是立法者和监管机构希望保护个人的可疑做法的例子。GDPR加州消费者隐私法(CCPA)这是两个经常被引用的例子。

Cinthia Motley, Dykema全球数据隐私和信息安全业务总监Cinthia混杂

Dykema律师事务所全球数据隐私和信息安全业务主管辛西娅•莫特利(cynthia Motley)表示:“CCPA的起源和历史,以及它是如何迅速实施的,都源于Facebook和剑桥分析公司。”“在GDPR之后,甚至在美国也出现了这样的结果作为CCPA的结果。许多州已经在等待复制粘贴法CCPA”。

欧盟委员会(European Commission)数据保护委员会(data Protection Board)表示,根据《GDPR》,截至2019年1月,欧洲数据当局报告了9.5万多起个人投诉,这些个人认为自己的隐私权受到了侵犯。

Omer Tene,国际隐私专业人员协会副总裁兼首席知识官俄梅珥烦躁

社交媒体数据的收集和使用在法律上是复杂的。“第一个问题是,数据是如何收集的?”悲哀说。“它是通过与社交媒体平台的合作伙伴关系收集的,还是报废的?”如果它被刮掉了,就会引发一些违反使用条款的法律问题,因为平台通常禁止刮掉,甚至有人认为这违反了《计算机欺诈和滥用法案》。”

在欧洲做生意的公司争相遵守GDPR因为罚款非常繁重。其他国家也在效仿,基本上是采用GDPR,或根据本国法律对其部分进行调整。

莫特利说:“个人信息被视为一项基本人权,世界上大多数法律都有这一概念。”“和其他许多国家一样,加拿大也在遵循GDPR。巴西是另一个完全采用GDPR的国家。中国增加了刑事犯罪。”

数据科学家不去假设收集或使用社交媒体数据的合法性是明智的。相反,他们应该寻求公司法律部门、总法律顾问、外部法律顾问或首席隐私官的指导。更重要的是,公司应该有可靠的数据治理计划,并为员工提供数据保护培训,以将潜在风险降至最低。

这些数据到底有多可靠?

传统企业数据(如交易数据)与社交媒体上的数据之间存在一些明显差异——最明显的两个差异是真实性和真实性。首先,社交媒体数据的来源可能不太明显。它是一个人,一个机器人,一个雇佣兵还是一个民族国家?这些“信息”是真的还是假的?即使是真人的个人资料也可能有意包含虚构的数据。

“这不仅仅是人们在社交媒体上说的话;独立软件制造商AvePoint的首席风险、隐私和信息安全官Dana Simberkoff推测道。“这些数据有效吗?”我不这么认为。”

Dana Simberkoff, AvePoint首席风险、隐私和信息安全官Dana Simberkoff

社交媒体挖掘是一门艺术和另一门科学的结合,Sreewastav说。她解释道:“这真的是在利用社交媒体数据,并以正确的方式进行推断。”"你推理的质量与你想要得出的结果直接相关"

两个潜在的缺陷是用推论代替数据和算法的偏见这可能导致歧视。“这里有很多的噪音和很多的不准确,”Tene说,“所以基于(社交媒体)数据做出的决定可能是完全错误的或对某种类型的人口有偏见,这是被低估或被高估的。”我认为,当你处理这样庞大的数据集时,数据质量会面临挑战。”

GDPR需要收集个人信息的法律依据。Simberkoff说:“我喜欢GDPR的一点是数据最小化和目的限制的理念。但是,良好的社交媒体数据管理不仅仅需要遵守数据收集和隐私规定。“确保你知道你在收集什么信息,你从谁那里收集,你用它做什么,谁能访问它,你保存它多久,你把它放在哪里,你什么时候摆脱它,”她补充说。

深入挖掘商业智能最佳实践

搜索数据管理
搜索AWS
搜索内容管理
搜索甲骨文
搜索SAP
搜索SQL服务器
关闭