大数据技术在新闻领域的应用(融合新闻生产)。


摘要:互联网的快速发展将人类社会迅速引入信息时代,新闻生产的方式随之更新,媒介开始呈现融合发展态势。

在信息过剩的今天,大数据的出现与发展颠覆了传统新闻生产模式,为融合新闻生产提供了新的思路和形式,在内容和表现形态上扩宽了新闻的深度与广度。本文以2016年美国大选的融合新闻报道为例,具体分析大数据在融合新闻生产中的具体应用与呈现方式,总结其区别于传统新闻报道的特点、存在的问题和未来可能的发展方向。


关键词:大数据;融合新闻



一、文献综述


近年来,“融合新闻”日益成为新闻报道的发展方向,针对融合新闻报道的研究也逐渐丰富和深入。


融合新闻是从应用新闻学的角度对媒介融合发展的研究,又称“多样化新闻”,主要指利用多媒体手段进行新闻传播活动。



根据美国西北大学教授里奇高登(Rich Gordon)的划分,作为多种媒介介质汇流的媒介融合包括5个层次:所有权融合、策略性融合、结构性融合、信息采集融合、新闻表达融合。前三个层次是宏观融合层面,后两个层次则是媒介融合操作过程中的新闻生产与呈现方式,具体表现就是“融合新闻”。


它是媒介融合的“终端新闻产品”,具有新闻业务整合化、新闻载体数字化、视觉传达多样化等特点。


随着融合新闻的发展,大数据的出现与发展颠覆了传统新闻生产模式,为融合新闻生产提供了新的思路和形式。大数据在内容和表现形态上扩宽了新闻的深度与广度,也增强了其可读性和可视性,并对未来融合新闻生产提出了更高要求。


大数据(big data),泛指巨量的数据集,具体来讲,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。


在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中,大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。


麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

IBM提出大数据具有5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。


大数据之所以被称为“大”,首要原因就是数据体量巨大。其数据来源极为广泛,既有人们每日媒介使用,尤其是社交媒体数据,也有政府数据和企业数据,还包括医院、学校、银行等社会基础机构,这就为新闻生产跨界合作提供了基础。


在已有的大数据结合新闻报道的融合新闻生产中,比较常见的是基于政府大数据的融合新闻报道。


诸如历年的春运报道,铁路局提供春节前后交通数据,媒体负责专题制定和新闻制作;又如近年来雾霾问题报道,将气象局历年空气质量数据进行整理、分析、挖掘,用适当的新闻呈现方式进行报道。


利用大数据,更能以事物的关联性作为预测未来的基础,启发新闻策划更多地关注文本和社会现象之间的相关性,策划出更有社会意义的报道,编排出更具传播效果的版面或专题栏目。


这要求新闻媒体在注重建立自身的数据库和数据传输渠道的基础上,加强与其他数据提供平台的合作,不仅降低数据获取和挖掘的成本,也能在合作中迸发新的灵感。




二、研究方法和案例选取



近年来,大数据这个概念愈发炙手可热,国内外媒体都创作了许多优秀数据新闻作品。


本文计划采用个案研究法,通过对具体案例进行分析,研究大数据在融合新闻生产中的具体应用与呈现方式,总结其区别于传统新闻报道的特点,探讨其存在的问题,未来可能的发展方向。


在案例选取方面,基于数据体量大、数据来源广泛、呈现形式多样等标准,本文最终决定选取2016年末的美国总统大选作为研究案例。


历次美国总统大选是世界范围内最受关注的话题之一,全民投票的大选形式所形成的海量数据为利用大数据进行新闻报道提供了良好素材,而美国大选本身又是极具重要性、时效性的新闻话题,因此,大选投票日当天,国内外多家媒体进行了数据新闻报道,进行实时票数统计。


本文选择国内的凤凰网和国外的CNN(美国有线电视新闻网)两家新闻媒体,从数据更新、数据处理能力、数据呈现形式等方面进行分析,比较两者利用大数据进行融合新闻生产的方式、特点、存在的差异,并探寻差异形成的原因。


三、案例分析


(一)数据更新



凤凰网美国大选实时票数统计(http://news.ifeng.com/wwwh5/special/mgdxkpsj3/)是凤凰网针对2016年美国大选特别制作的网页,实时跟进各州开票进度。


CNN的美国大选结果(http://edition.cnn.com/election/results)则在官网Politics栏目下开设Election Results,跟进每个洲的开票结果。


尽管网页数据更新要跟着各州开票结果的更新而动,但相比而言,凤凰网的更新频率比CNN官网更高,在开票最后阶段,凤凰网的开票数据领先于CNN,更先一步确定了特朗普的胜局。





事实上,美国大选总票数为538票,先获得270票者胜出。11月9日当天,计票结果为特朗普306票比希拉里232票,随后绿党候选人吉尔·斯坦(Jill Stein)要求重新计算威斯康星州、密歇根州、宾夕法尼亚州票数。美国联邦法律规定所有重新计票必须在大选后35天内,即12月13日之前完成。12月7日,美国密歇根州地方法院院长叫停重新计票。至12月13日,仅威斯康星州完成了重新计票。


凤凰网将密歇根州统计状态标注为“进行中”明显不合事实,可以推断最后一次更新在密歇根重新计票被叫停之前;CNN的威斯康辛州票数统计更新至11月28日,尽管重新计票结果依然为特朗普胜出,也表明CNN并未跟进重新计票的进度。



(二)数据处理的能力


基于以上原因,凤凰网在最终票数统计中扣除了密歇根州的16票,显示特朗普290票比希拉里232票,与最终结果产生了准确性上的偏差。




此外,美国大选开票当日,凤凰网的票数统计曾出现波动,特朗普的得票数在200票前后时出现票数下滑,这是由于票数统计未完,凤凰网就进行了过早的获胜判定,而最终结果产生反转。CNN的更新虽慢,基本是在某洲票数全部统计结束之后才进行数据图的修改。




在大数据种类和数量层面,CNN所展现的选举细节提供选超凤凰网。


在各州票数细节的统计上,凤凰网提供该州的总票数、计票状态、双方票数百分比和已开选票百分比(仅在开票过程中呈现);

CNN在首页显示类似的信息,然而点击各州将打开新网页,讲呈现该州具体的投票结果,包括其他候选人票数和各郡(县)、市票数。




在全美票数统计的过程中,CNN不仅以行政区域划分,也从全国人口、参议院、众议院等角度统计了选举结果。

除此之外,CNN还抽样统计了选举人的年龄、性别数据,以表格的形式将数据呈现出来,全方位、多角度地报道了美国大选的方方面面。





(三)数据呈现形式


大数据的呈现主要依赖对数据分析结果的图表化,凤凰网和CNN都在此次新闻报道中尝试了多种数据呈现方式。


凤凰网的统计页面更多地照顾到手机端用户的阅读习惯,整体页面多屏、“瘦长”。

票数呈现采用了“记分牌”的形式,增加了竞争感,采用数据地图的形式展现美国各州的选举结果并对应填色,将鼠标移动到具体的州地图上,将弹出该州的票数统计详情,以设计感较强的动态展现形式,表现红蓝两个色条的增长。



在呈现和比较两位候选人具体票数数据时,采用以柱状图为基础的可视化图表。在各州选情呈现图表中,点击候选人头像,可以看到该候选人的所有获胜州,并以支持率降序排列。



CNN也采用了数据地图的形式,不仅做了以州为划分的全国数据地图,还做了每个州内部的数据地图。这两种地图有形式上的区别,各州地图是实际地域外形,全国地图则将每个洲简化为一个圆圈,圆圈中包含该周的缩写、总票数和红蓝颜色,并给关键州标上金色外圈。鼠标移动到圆圈上同样会弹出具体信息。虽然形式简约,所能呈现的数据体量却更大了。


在数据图表化的呈现中,除了简约风格的表格,CNN也有创新之处,在呈现众议院结果时,CNN借鉴了众议院座位的安排,也将图表设计成半环座椅的样子,生动且简明。





四、研究结果


可以看出,凤凰网和CNN的美国大选报道,作为大数据融合新闻的代表作品,区别于传统新闻报道的特点表现得非常明显。


基于网页制作技术和数据分析处理能力,大数据融合新闻能做到更加实时、直观地反映数据及其动态变化;采用数据图表与文字解释相结合的方式,在丰富了报道信息量的同时降低阅读难度;

网页的交互功能“华而有实”,恰当地地整合了繁杂多样的数据,对读者而言极大地提升了阅读体验。


与此同时,凤凰网和CNN在选举数据获取、分析和呈现方面存在许多差异。


造成差异的原因有很多,首先是新闻媒体所在地的优势。

CNN作为美国本土大型媒体,本身数据来源广,又因是本国事件,对本国国情了解极深,接近性强,方便掌握一手数据、准确数据。凤凰网即使有再多的外派记者在现场,在地域优势上本身落后。



在数据呈现的方式上,凤凰网融合传统图表和数据地图,“记分牌”的票数对比是亮点,赢得了网友的一致好评;

但是CNN在整体的设计思路上既简约又多样,细节信息准确丰富,呈现上也不马虎。

这种差异体现出我国新闻媒体在融合大数据技术进行新闻生产的过程中,仍存在设计思维仍不够开阔,数据整合形式较为单一的问题。



但就传播效果而言,国内民众更关心大选结果,凤凰网的报道快速直观,CNN的报道丰富详实,实为满足不同受众的需要。




五、当前存在的问题


基于对上述案例的分析,综合考虑目前已有的大数据融合新闻报道的研究与实践,可以看出,目前我国对于大数据在融合新闻生产中的应用还存在一定的问题,具体表现为以下几个方面。



(一)数据获取与分析能力不足


数据规模越大,处理的难度也越大,但对其进行挖掘可能得到的价值更大,这就是大数据热的原因。从分散的、非结构性的、缺乏已知关系的大数据,到集中的、结构性的、已知相关复杂性关系的数据,再到可供新闻生产、图表化呈现的新闻报道,这其中需要经历数据收集、数据分析、数据呈现三个最主要的环节。


在数据收集方面,现有的数据开放程度不高是制约大数据参与融合新闻传播的一个重要因素。数据开放的程度在各国不同,我国政府做了开放数据的努力,但距离英美两国还有很大差距。


与此同时,数据分析和挖掘首先要对已收集的数据去伪存真,而后需要专业的技术进行处理。技术上的困难成为大数据应用的一个难题,一旦出现设备、技术的垄断,大数据将无法发挥真正的作用。



(二)数据呈现方式不当


目前,国内仍有较多依托大数据进行新闻呈现的作品,尽管努力进行了可视化,却没能让受众获得愉悦的阅读体验。这种结果主要有两方面原因:设计不足或设计过度。


一方面,很多“数据新闻”依然算不上真正的数据新闻,它们的大多数设计仍停留在装饰新闻,配图解说水准上,设计感不强、美观程度低,也没有摆脱装饰的附属地位,而不是对新闻内容进行设计。


另一方面,试图对数据本身进行设计的,又因为现代设计技巧的不足,仅有内容没有形式,传播效果大大降低。数据新闻的立足点是数据的真实可靠,不能为了视觉效果的呈现,增加各种无意义的噱头设计,设计过度反而过犹不及。



(三)唯数据论


随着大数据越来越普遍地应用到新闻生产中,新闻从业者做出了许多宏观把握社会现状,内容详实的新闻作品,但是将数据作为新闻生产的唯一准则,忽视新闻记者的现场采访和价值观判断,是与新闻精神背道而驰的,更不必说冰冷的数据无法呈现人的情绪和思想了。


此外,数据的来源、分析过程中若是出现偏差,极有可能造成最终结果的整体错误,而负责将数据呈现环节的从业者很难发现,新闻的真实性受到挑战。


新闻从业者应当始终坚守职业道德与准则,提高辨别数据真实性、价值性的能力。避免唯数据论思想,合理地将大数据与新闻生产的实践结合在一起。


(四)新闻浅层化风险


区别于传统新闻报道的长篇大论,可视化的数据新闻一张图、几句话将新闻事件的重点信息,直观地、形象地表现出来。


人们从读文时代进入到了读图时代,图像带来的感官体验和冲击力远高于文字,但图像的易读性使人们根本还来不及深入思考就已经切换到下一张图,大脑的兴奋停留在色彩、图形的刺激而不是对某个思想、某种情感深入体会后的愉悦。


融合了大数据技术的融合新闻尽可能将繁杂的数据可视化、动态化,利用图表和软件技术将数据展示变得生动有趣、易于理解,但它带来的新闻内容表面化、浅层化的问题,这其中的博弈值得融合新闻生产者反思。



(五)全能人才稀缺


大数据时代的数据处理很多时候需要借助统计学、管理学等关联学科的既有技术,在原有的新闻从业者群体中,只有较少的一部分能够熟练掌握数据分析技术。

即使高校开设相关专业,掌握技术的年轻学子涌入新闻行业,在整体数据处理专业性较低的大环境下,数据分析的精确度、可信度受到质疑。


目前,国内部分高校已经开设了数据新闻报道相关专业,对数据新闻专业人才的培养已经开始,但总体而言尚未足够。



六、发展方向展望


(一)“真正的”数据新闻


数据新闻是当前大数据与新闻媒体融合最紧密的形式,主要经历了以下几种形态:


在新闻话题或新闻事件的文字、图片报道中加入图表化、可视化的大数据作为延伸补充;

以图表为主,文字为辅的,基于已有的社会现象,依托大数据分析所得去佐证和深入的新闻报道;

以及以数据为主体,数据可视化形态为主要呈现手段,文字仅作图表注释作用的新闻报道。


这其中,第三种数据新闻才可以称得上是“真正的”数据新闻。在融合生产的过程中,大数据技术不再仅仅停留在对数据的处理技术上,更包含从杂乱无章的数据中挑出逻辑和问题的能力,从数据中找到新闻,才是最高层次的数据新闻。



(二)融合新闻互动


与受众产生互动一直是新闻从业者所追求的传播效果,除了简单的评论、留言、实时弹幕、VR交互,在大数据的分析指导下,个体兴趣与爱好极易获得,媒体平台针对性地投放和推荐新闻,在相似度较高的群体中形成话题,受众在话题发酵的过程中形成自己的看法,再反馈给媒体平台和新闻生产者形成新的思考、新的话题。这种方式可以构建媒体与受众相互交流的有效桥梁,形成良好的互动效果。


在大数据应用层面,期待政府、企业、社交媒体平台等开放技术和数据壁垒,一方面为新闻媒体的融合发展提供便利,另一方面,降低技术和数据门槛,用户也能参与到大数据分析和数据可视化创作,有利于大数据发展。



(三)个性化推荐


大数据时代,受众在媒体平台上各种行为都被数据记录,在高度发达的社交网络、移动互联网中,用户的媒介使用习惯和兴趣极易被记录和追踪,经过系统的分析,形成用户兴趣、用户标签,这些精确测算所得的用户需求将成为个性化新闻产品推荐的基础。


除了针对性地投放新闻内容,个性化定制还包括针对性地选择推荐的时间和空间,配合用户的媒介使用习惯,达到最精准有效的传播效果。



七、总结


适应大数据时代媒介融合的需要进行改革,无疑具有现实意义,但这并不意味着完全抛弃旧有的新闻生产准则和新闻专业主义精神。融合新闻生产者依然是“把关人”,依然遵循真实性、客观性原则,依然需要批判地看待社会,积极地揭示社会问题。


在“媒介融合”、“大数据”等概念炙手可热的今天,推动传统媒体和新兴媒体共同发展,以优质的新闻内容为“里”,新媒体技术和平台为“表”,才是融合新闻发展的最佳方向。


融合新闻生产者既要学会利用大数据进行更优质的新闻创作,又要适应大数据的融入对新闻业态、新闻生产带来的变化和影响,更要警惕大数据可能带来的风险和挑战。

现在的大数据应用距离成熟很大的距离,仍需广大新闻从业者在实践中积累丰富经验,为融合新闻发展添砖加瓦。


Copyright 2015-2035 西安越影信息技术有限公司 YUEYINGIT.COM | 陕ICP备2020016252号-1
客服QQ:58155571
Top