大数据新闻的发展经历了几个阶段,了解大数据新闻需要厘清与之相关的若干个概念——数字新闻、精确新闻以及数据新闻。
数字新闻是指以可视化的数字、线条、图表等静态形式为辅导进行新闻制作和报道;
上世纪中旬,有美国学者利用计算机对政府公开数据库中的数据进行整合筛选与分析从中挖掘新闻事实辅助记者完成报道,学界称这一阶段为“计算机辅助报道”;
20世纪60年代美国记者迈耶提出精确新闻的概念——新闻记者在进行新闻采写时运用社会学的研究方法和理论进行调查研究,通过素材收集、信息核证从而生成新闻报道。
1、 什么是大数据新闻
2009年国外知名媒体英国《卫报》在其网站上开设了“数据博客”栏目标志着对数据新闻探索的开始。
国内方面,2011年开始几大门户网站和央级媒体开始探索数据新闻报道——搜狐的“财政样本”节目和“数字之道”栏目、网易的“数读”、新浪的“图解天下”、腾讯的“数据控”以及新华网推出的“数据新闻”栏目等都进行了有益的尝试。
2010年8月,在首届国际数据新闻圆桌会议上,参会学者对数据新闻做出了以下定义:数据新闻强调的是一个工作习惯和流程,通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化的呈现数据并合并成新闻故事。
数据新闻是介于精确新闻与大数据新闻中间的产物,三者均是以数据为驱动进行新闻生产与制作的,而区别则在于对数据的应用、解读和思维上。
2013年初英国学者维克托·迈尔·舍恩伯格的《大数据时代:生活、工作与思维的大变革》在国内出版,书中作者将大数据的其中一个特征概括为“非抽象而是全体”,这一点与新闻传播领域中某些要求不谋而合。经过了十多年的发展,大数据新闻愈发成熟,但是存在于其中的问题也开始日益凸现出来。
2、大数据新闻发展面临的挑战
当前大数据新闻数据的获取、整合和分析主要依托web2.0时代的计算机与互联网技术,新闻传播行业对技术的利用和融合尚处于初步探索应用阶段,其周围存在着诸多壁垒。
2.1、 数据来源多样性受阻且内容与形式上难有突破
现有数据新闻的数据多来源于权威政府机构和研究所,以人口、经济、工农业等主题为主,可选择切入的新闻点和报道范围有限难以做到“深度”报道,无法充分发挥数据新闻的优势。
近年来包括阿里巴巴、腾讯等在内一些第三方商业机构和清华大学等高校统计机构开始进行数据库的建设,但是在统计领域和开放性上普通媒体还是难以触达的。
对于普通媒体而言分设主管数据新闻的部门、建立专门的数据平台以及培养和引进专业的人才的每一步都显得举步维艰。
国内的一些门户网站和媒体进行了有关数据新闻的初步尝试,但无论是内容上还是形式上都没有充分发挥互联网的展示优势皆是浅尝辄止,整体上表现平平未见有太大的创新和突破,与其他国际化的媒体相比仍有较大差距。
数据新闻制作周期长、要求一定的技术门槛且花费较大因此内容上多为国家大政方针和对新闻时效性要求相对较低的民生热点和问题,无法做到与短视频或图文报道等其他新闻形式一样地即时报道;
形式上除了在原有静态表格和文字编排上加入动态图表、时间变化轴、音视频等可视化元素外没有较大提升,很难在用户感官体验和互动体验上进行创新。
2.2 并非所有的新闻类型都适用于大数据报道
大数据技术追求的核心是全数据、多视角,因此并不是所有新闻内容都适合采用大数据技术进行制作呈现。
当我们进行典型人物报道时可以采用大数据技术对被报道人物的基本信息等情况进行全方位地呈现,但是典型人物报道的典型性和生命力就在于其人物故事的表达,过分强调形式和数据会将先进事迹淹没达不到报道的立意,效果也会适得其反。因此,大数据技术的使用要符合新闻传播的基本属性和要求,真正做到让技术为叙事服务。
受众生来就有偏向于接受不需要思考的简单事物的特点,层级与触达率成反比——获取数据的层级越深参与阅读的受众就越少。
大数据新闻自诞生之日起就有着“重逻辑、薄情理”的特性,经常会表现出去故事化倾向的一面很难调动最广大受众的阅读兴趣,他们并不愿意去深挖这些数据背后的价值。
对于制作者而言,一则大数据新闻作品的呈现往往会花费包括新闻记者、技术人员、设计美工人员等在内的团队的数以月计的时间,如此投入如果不能产生较好的传播效果就会造成成本无法收回、资源浪费和难以为继等结果,长期以往会消磨制作者进行大数据新闻创作的热情。
2.3 信息泄露以及信息窄化
大数据技术的发展日新月异,对于数据的挖掘和分析能力也在不断增强。
新闻生产者可以为用户提供个性化的信息定制服务,当用户在进行信息检索、浏览时其使用痕迹和习惯会被后台记录和采集,经过长时间不间断的分析可以生成关于用户阅读时间、内容偏好和潜在兴趣区的报告。
系统会根据报告在之后的时间里进行相关内容的推送力求为用户减轻接收负担、节约信息获取的成本。
但受众因此也可能会被铺天盖地的同质信息所包围局限在自己的“舒适区”内不愿尝试接收新的知识和领域,很容易像蚕蛹一样被茧房所束缚,“茧房”一旦形成便很难突破其的桎梏,在传播学上我们称之为“信息茧房”。
3. 大数据新闻发展策略探索
大数据新闻有着其他形式的新闻报道无法比拟的呈现优势,这些优势驱使着越来越多的媒体和新闻工作者去靠近它。大数据作为一项技术亦是一把利刃的双刃剑,这些隐忧需要我们不断思考寻求解决方案。
3.1 拓宽信息获取途径
除了在政府和机构公开的数据中采集信息外,采集网页数据也是一种重要的获取数据的方式,互联网本身就是一个未经清洗的海量数据库,网页采集耗时短、效率高、成本低因此广受媒体的青睐。
新闻媒体可以使用python等编程语言和数据采集软件进行数据的采集获得最原始的一手数据。
此外,媒体制作数据新闻要积极调动各方资源主动与政府、机构和受众合作。2014年春节期间央视《晚间新闻》栏目首次与百度合作推出了“据说春运”的专题报道,依托于百度公司基于位置服务的定位技术采集分析了亿计用户的出行信息利用可视化的手段向受众展示了关于春运迁徙以及出行提示的新闻,该专题一经推出便广受好评之后的几年一直沿用。
此种合作是建立在有实力的媒体和有资质的企业基础之上的,企业借助媒体平台获得长足的品牌曝光、增加流量和市场占比,媒体则充分利用了企业所提供的数据信息为广大受众提供了信息服务,二者互惠互利。
但是对于实力尚不足以与数据公司合作的最好的办法就是面向受众直接进行数据资源的获取,媒体除了可以使用最常见的发放调查问卷的方法外还可以“众包”的方式进行。众包指的是公司或企业等机构将工作分配出去利用社会大众的力量集体完成的做法,常见于物流配送领域。
2014年春节南方周末发起的“回乡测水”的行动为公众提供了低成本且便携快速的水质检测工具使其能够对其家乡的水质资源进行实时监测上传水质信息与他人分享,这种做法极大地调动了受众参与的热情节约了成本。
3.2 转变思维提升传播效果
新媒体环境下受众角色发生重大变化,受众角色从以接受为主要行为的读者转变为渴求主动参与以点赞评论转发等信息反馈行为的信息提供者,成为了媒体内容生产的重要组成部分。大数据新闻制作者要树立大数据思维始终站在受众角度思考问题、时刻回到受众角度解决问题、以受众需求为导向进行产品的创作。以此来解决受众获取信息的痛点和需求、丰富受众体验为受众体验延伸带来更多的可能性、最终达到增强受众黏性实现内容变现为媒体平台增值的目的。
大数据形成之后也会产生一系列隐忧,这些问题的解决需要大数据新闻制作者和受众一同发力。媒体要在各种新技术的浪潮中抓住机遇抢占制高点,促使大数据新闻进一步发展和完善产生更佳的传播效果。
3.3 科学运用和分析数据
媒体时代的数据并不只是简单的数字,语言、行为、习惯等具有象征意义的符号都可以被视为某种形式上的“数据”。
对于受过专业教育的新闻工作者而言,新闻的真实性始终是恪守于心的第一要义,对于数据的处理不应是认为一事物与另一事物密切相关就认定两者有着必然的因果关系,而应是在大数据思维的指导下经过严谨地研判得出发散性的结论,这比单纯地依靠表面数据进行臆想推测要准确且合理的多。
我们生活在一个复杂的传媒社会中,每一天都被“黑天鹅”环绕着,数据繁杂且变化瞬息万变在对数据进行获取、清洗和筛选时不容有失,稍有差错便会前功尽弃。
大数据新闻的生产与制作除了要求媒体记者和编辑有较强的新闻职业素养外还应具备相应的大数据思维和处理数据的基本能力,几者犹如稳定的三角关系缺少任何一个都会打破平衡导致失败的结果。
4. 结语
新闻传播行业要逐步进行自主、有效的数据搜集打破第一个壁垒,其次要加大投入进行人才培养和数据分析能力培养打破第二个壁垒,这是进行有价值的信息传播的关键一步。
新闻传播行业对大数据技术的运用除了单纯的进行新闻的生产外更重要的是将大数据技术的理念渗透到新闻采写和生产的各个环节。
由于人员、技术、设备、资金等方面的原因并不是所有的媒体机构都有能力去进行大数据新闻的创作,这也就决定了大数据新闻这种新闻形式只适合在少数实力雄厚的传媒集团进行传播。
但是我们相信随着5G技术、人工智能技术以及计算机技术的发展,未来大数据新闻会成为主流新闻媒体的标配并逐步向下一级媒体平台推广。