大数据分析助阵世界杯球迷狂欢月

2014-07-21 |  作者:网界网 于翔 |  来源:互联网 |  查看原文

摘要刚刚结束的巴西世界杯足球赛不仅仅是一场体育赛事的盛宴,也是一次网上社交的狂欢。球迷们在微博、微信朋友圈的评论、吐槽和讨论都成为了大数据分析实战的绝佳素材。

【CNW.com.cn 专稿】刚刚结束的巴西世界杯足球赛不仅仅是一场体育赛事的盛宴,也是一次网上社交的狂欢。球迷们在微博、微信朋友圈的评论、吐槽和讨论都成为了大数据分析实战的绝佳素材。

将备受追捧的创新科技与时下万众瞩目的社会事件结合起来,恐怕没有什么比大数据分析和世界杯赛事报道的组合更加应景的了。在多屏联动、全民社交参与的背景之下,2014年的巴西世界杯足球赛(以下简称为巴西世界杯)堪称是一次真正意义上的全球化、社交化的世界杯。赛事期间,球迷们通过微博、微信朋友圈的评论、吐槽和讨论产生出海量的数据内容。他们已经不再仅仅是赛事信息的被动拥有者,也是内容的重要生产者。

毫无疑问,社交媒体改变了内容创造者和传播者的结构配比。而借助球迷社交互动的所产生海量数据,媒体又能够获得哪些价值呢?在刚刚结束的巴西世界杯期间,IBM的大数据分析专家和腾讯体育频道的编辑们进行了一次有趣的合作。双方通过对网上互动海量数据的采集、筛选与分析,为球迷们营造出不同寻常的观赛体验。

360°描摹球迷画像

一谈起大数据技术在企业应用的形式,360°客户视图总是会被频繁提及。如今,这一应用形式被IBM的大数据专家们用来对球迷的性格特征进行分析,从而对不同球星粉丝的类型加以区分和刻画。比方说,通过粉丝们在社交媒体上所发布的内容以及参与的讨论,分析出巴西球星内马尔的粉丝大致可以分为内向外向型和认知开放型两类,他们的个性关键词是“活泼”、“爱热闹”、“简单”和“欣赏美”。这样的球迷画像在腾讯的世界杯专区中定期推出,鉴定自己真球迷的“含金量”迅速成为网友们的热门话题。

大战之前,预测结果是球迷们最重要的观赛乐趣之一。与其他的网站所不同的是,腾讯网为球迷们提供的可是基于实时分析的球迷支持率对比。借助IBM的语义分析技术,大数据分析系统对社交网络上球迷发出的海量数字声音进行采集和分析,判定其对不同球队或球星的态度,从而呈现出更加贴近球迷真实观点的支持率对比。球迷们虽然没有投票,但是其观点已经被大数据分析系统所采集,并且进行实时地展现。

对球迷态度和心理的了解还改变了体育编辑们的工作方式。借助大数据分析的结果,编辑们的选题制作不再是闭门造车。在准确收集球迷的关注热词、热点话题、关联话题分析的相关信息后,体育编辑们往往能够在第一时间就制作出有针对性的内容,从而为球迷们呈现出更及时、更能引发共鸣的报道。

大数据和云鼎力支持

世界杯期间,球迷们通过腾讯网所获得了观赛新体验仰仗于大数据和云计算的鼎力支持。针对球迷社交数据的分析是建立在IBM大数据分析平台之上。据IBM中国研究院信息分析研究部研发总监苏中介绍,IBM大数据分析平台内置有超级数据引擎,IBM中国研究院的工程师们在其上针对世界杯期间社交数据的分析需求进行数据建模,构建起一套定制化的大数据分析体系。

IBM中国研究院信息分析研究部研发总监  苏中

“在世界杯期间,系统从微博等社交媒体采集了大概10亿条的赛事相关数据,其中与64场具体比赛相关的超过1亿条。我们将其中的那些具有推广营销等性质的数据噪音去除(+微信networkworldweixin),每天用于分析处理的数据量在百万条至千万条之间。”苏中说。这些数据被注入定制开发的数据模型之中,因为融合了机器学习和自然语言分析等技术,系统能够像人一样地去理解球迷在微博中所表达的想法。苏中表示,经过测试,这一系统可以进行深入的球迷情感挖掘,对模糊语言有90%的正确判断力。

庞大的数据量和实时分析的需求,无疑需要消耗大量的计算资源。但这一应用需求的时限仅仅是赛事举办的30余天,为此建设长期的物理计算体系并不现实。IBM的技术专家用云端部署的方式解决了这一问题。2014年6月,IBM Softlayer公有云服务在香港的数据中心正式投入运营,球迷社交数据分析平台随即入驻这一公有云平台。据IBM大中华区全球信息服务部云计算服务总经理余忠宁介绍,球迷社交大数据分析项目共使用了10台Softlayer虚拟机,SoftLayer公有云服务平台很好地满足了系统在海量数据分析时对弹性计算能力的要求。他透露,IBM Softlayer公有云服务在大陆的数据中心有望在2014年年底、或2015年年初正式投入运营。

相关文章