数据存储产业服务平台

曙光大数据应用:挖掘广电行业海量数据金矿

广电行业作为一种发展历史较久,生态系统相对成熟完善的行业,在我国现代化建设过程中发挥着重要作用。然而,随着互联网时代传播载体、传播内容的爆发式增长,特别是微博、微信等社交网络和新媒体的快速发展,对传统广播电视体系的冲击越来越明显。那么,在大数据时代背景下,广电要如何应对?如何选择适用的平台?如何挖掘和利用大数据技术,实现“台网联动”,从而提供更加优质的服务呢?

为此,曙光以坚实的大数据技术积累为基础,推出了针对广电行业的大数据解决方案,可以帮助广电行业高效分析海量传播数据,深入发掘用户需求,在大数据时代获得更强大的前进动力。

从“大众覆盖”到“大众互动”广电行业的融合之道

美剧《纸牌屋》的实践证明,新媒体在大数据信息高速流转的平台上,作为电视内容生产的服务对象,受众在接收传播内容的将产生大量的互动内容,如节目观感、评论,甚至自制的内容文本等,这些信息迅速聚集并传到电视播出平台,这不仅能丰富内容产品的互动性,提升受众积极性,更是对传统电视内容生产方法的增益。但广电行业又有别于新媒体中的大数据技术应用模式,在推送中需要更精准的分析出这个群体的结构需求,而不再像以往的收视率调查采用样本户的方法。

在新媒体时代,用户的信息饥渴感在与日俱增,但对非关联信息的容忍度却在与日俱减,这就要求广电行业利用大数据挖掘用户需求,给用户提供真正有价值的信息。

另外,从个人向群体(如家庭)的变化,不仅是信息消费者个数的改变,消费模式与特征也发生了变化。在电视大屏前,用户行为不再是简单的碎片化与去中心化,而出现了一种群体性的选择偏移,即大屏幕前的用户行为有选择的积聚趋势,但积聚中又有个性化。那么,要抓住个性化的趋势和群体需求特征的结合点,就必须依赖于大数据技术。

以高性能计算为根基 聚焦广电行业海量数据特点

在大数据时代来临的大环境下,我国的广播电视行业正在进行自适应调整,它既是信息数据的生产者、拥有者,同时也需要逐渐成为信息数据的使用者、受益者。

为此,曙光凭借多年在高端计算领域的坚实技术积累,曙光公司在全国进行了大数据时代的战略布局。近年来,曙光以创新的理念为基础,在原有的海量数据处理平台中融合了最新的Hadoop分布式框架,使其能更高效地处理结构化和非结构化数据。曙光推出的大数据一体化解决方案更是采用了创新数据处理技术和开放式架构,可以为大数据应用构建真正高效、智慧、易用的整体解决方案。在应用体验上,它能够帮助客户快速、智能的分析海量数据,以提高洞察力并做出明智决策,并为客户从大量数据中挖掘出体现价值的“金矿”。

大数据精准评估“关系” 7大模块赢在全媒体时代

目前,曙光大数据解决方案已经率先在金融、电信、教育、国防等领域实现了大数据的成功应用,并针对大数据在广电行业的潜在应用量身定制了广电行业的大数据解决方案。

该方案(采用曙光XData-hadoop优化版软件)基本可以分为以下7个大模块:数据采集模块、数据计算模块、数据存储模块、应用分析展现模块、系统监控管理模块、大数据仓库和主干互连模块,其中:

HDFS为主存储模块和MapReduce为主的计算模块只采用直通的方法,其它模块的数据和管理通信都通过主干互联平台。

数据源采集模块主要包含三种数据类型:样本机顶盒数据和VOD视频采集数据,机顶盒操作日志数据采集和分析,通过采集策略来控制采集。

数据计算模块主要负责所有数据的ETL,清晰,封装及其装载的服务,同时分析任务的执行也在此模块中进行。

应用分析展示模块主要负责B/S数据分析结果展示,和相关数据应用的部署。

系统监控管理模块负责该平台软硬件组件的监控管理工作。

该解决方案基于服务器集群搭建大数据平台,可以改善现有非结构化数据离线服务水平;突破在传统技术手段下无法解决的海量数据存储弹性扩展能力差、备份恢复难度大的问题;利用结构化与非结构化历史数据资源集中优势,为业务提供更集成 、更长时间跨度、更多维度的数据查询服务,提升相关业务的查询访问效率,改善客户体验;使离线数据真正上线并得以充分利用,提高大量半结构化非结构化数据利用率,为业务发展提供基础。

广电行业呈现“两大“应用趋势 大数据成为营销利器

在曙光看来,2014年广电行业大数据的应用趋势可以分为以下两类:

第一类:收视率预测和节目营销

电视节目收视率和微博讨论量存在着正向关系。微博讨论量,可以成为预测电视收视率的重要指标。同时,对于节目推广而言,参与节目话题讨论的用户,不是电视观众,就是网络视频观众。这些用户ID,都是此节目的受众。如果针对这些用户投放广告或推送内容,效率肯定会很高。

第二类:台网联动的跨平台营销

随着电视与网络平台的互补价值不断凸显,“台网联动”已成为网络媒体与传统电视媒体走向融合的重要特征。之前,微博已经在尝试台网联动的营销解决方案。具体为,微博将热门电视节目设定为“热门话题”,在PC端和移动端设置话题入口,吸引网友进入“热门话题页”,引发网友分享与互动,进一步放大冠名电视节目的企业营销权益;

此外,节目直播的同时,微博会同步在信息流中对节目话题进行话题推荐,保证该时间段内的展现机会,再次加强企业推广效果;通过用户获取信息的核心区域-信息流与话题榜的推荐,将话题的热度最大化,从而达到提升品牌知名度的目的。

因此,我们可以预见2014年的广电行业,大数据应用的针对性将更强,用户更希望在决策力、洞察发现力和流程优化能力方面得到帮助。为此,曙光将在2014年,将会继续秉承“立足平台,深耕应用”的大数据战略,继续加大对研发投入,在目前已有的parastor云存储、cloudview云操作系统、XData大数据平台上,形成核心技术群,打造出更优秀的产品。同时,曙光还会把各个行业中率先形成大数据应用的最佳实践,在广电大数据行业的应用上深耕细作。

未经允许不得转载:存储在线-存储专业媒体 » 曙光大数据应用:挖掘广电行业海量数据金矿