一、导言
在当今海量数据的不断产生和积淀的时代,博物馆如何利用自身采集或拥有的各类数据资源,并通过数据的分析、挖掘及有效的呈现产生新的效用,是博物馆数字化建设今后所应该努力的方向。
这其中,数据可视化就是一个可供开发和利用的新技术。
本文介绍了数据可视化的一些基本概念,分析了它与博物馆之间的相互关系,并通过上海博物馆的一些案例来展现这项新技术在博物馆数字化建设中的一些应用场景,借此为今后数据可视化技术在博物馆中的进一步运用提供参考和借鉴。
二、什么是数据可视化
数据可视化作为一门技术,从20世纪80年代就开始出现。当时的定义可概括为:“运用计算机图形学和图像处理技术,以图表、地图、标签云、动画或任何使内容更容易理解的图形方式来呈现数据,使通过数据表达的内容更容易被理解。”
而随着数据数量和种类的不断扩张以及人们对数据可视化研究的深入,单一的可视化已很难满足人们越来越多的对于挖掘数据中存在的各种隐形关系的需求,可视化慢慢发展成为一个涉及数据挖掘、人机交互、计算机图形学等的综合性学科。
由此,将数据挖掘技术与可视化技术相结合起来,成为人们从海量数据中汲取有效信息的一种良好方式。
数据可视化的实现步骤
①、数据抓取。
通过接口或其他抓取技术从多个系统及网络上抓取数据,并将其保存到相关的数据库。
②、数据选择和数据清洗。
对选择出的数据进行数据清洗,将数据转变成“干净”的数据。
③、数据转换。
将清洗后的数据转化成关联规则算法所能接受的格式。同时对数据进行关联分析,尽可能发掘出数据背后隐含的有价值的信息和规律。
④、主题挖掘。
使用技术手段对转换后的数据进行主题挖掘,发现数据相对集中的主要的观点和论述。
⑤、可视化。
以适当的可视化技术,对数据集进行可视化展现,同时运用图谱等手段对关联关系进行可视化,使关联的结果一眼可见,让观者可通过观察得到启示和发现。
从广义上讲,通常人们所理解的数据可视化本身还应该包括科学可视化、信息可视化和知识可视化等内容,但其关注对象则一直是相对狭义的数据。
近年来,数据可视化的发展在需求变化的不断推动下持续发展,从简单的静态记录,到有绚丽图像的动态展示,形式由简单到复杂,功能从单一到多样,技术从计算到智能,都显示出它的旺盛的生长能力。
有学者认为,目前的数据可视化已经是一种不以图像显示为目的,而以增强理解为目的的数据展示。而当下大数据热度的持续升温,也预示着数据可视化的热潮在可预期的将来还将一如既往地延续下去,并将被推升到一个新的高度,变成一个新的起点。
数据可视化的可贵还在于它不仅仅是属于专家所有,而是更强调要为人服务。
数据无论进行怎样的挖掘和分析,但其最终目的都是将数据中所蕴含的信息呈现给观者,让观者通过数据可视化设计体会到信息背后的故事。
为达到这一目的,数据可视化就需要有一个共同的要求,那就是准确而高效、精简而全面地传递信息和知识,从而尽可能让数据自己来说话。
那么,什么才算是一个好的数据可视化?
这里援引一位台湾学者的观点:数据可视化能做到简单、充实、高效,兼具美感就是好的可视化。成功的可视化的美妙之处既在于其艺术设计,也在于其通过对细节的优雅展示,能够有效地产生对数据的洞察和新的理解。
典型如名为“NORSE”的网站制作的“全球黑客攻击示意图”。
这个网站可以观测实时的网络攻击,难能可贵的是,它把原本抽象的网络攻击表现得非常具有画面感,地图上的亮点每闪烁一次说明该区域有黑客进行了一次对外攻击活动,而光线所指向的区域,则代表了被攻击的对象所在的区域。
全球黑客攻击示意图
当然,要做好一件数据可视化的产品并不容易,它除了需要开发者具备良好的数据分析能力和熟练使用可视化技术方法之外,还需要有较好的美学素养和较强的用户体验感觉,而更为重要的是需要数据收集和整理等基础性工作的保障。
三、博物馆与数据可视化
博物馆本来就多以直观的方式作为最主要的与社会发生联系的纽带,故此,可以说可视化是博物馆与生俱来的一种基因。
陈列展览作为一种可视化的呈现,一直是博物馆传播知识、实现社会价值的重要载体。
但此类可视化只是一种物象或图景的展现,只是可视化的最直接的表露,与我们现在所说的数据可视化有着很大的不同。
真正的数据可视化是随着博物馆数字化的进程而逐渐浮现的。
当博物馆的各类数据,藏品数据、业务数据、管理数据、研究数据、观众数据等一一被纳入采集的视野,并成为数据库中的沉淀数据以后,如何激活、用好这些数据,发挥它们的价值,就成为很多博物馆尤其是数字化从业人员经常思考的问题。
也许有人会问,博物馆本来就以物体的直观显露为特点,博物馆为什么还要做数据可视化?
它对博物馆的工作能起到什么作用?实际上,博物馆本身就存在着可视化的需要,即以艺术类博物馆来说,“艺术本身在某种程度上就是对思维和想法的图像化、可视化呈现。
艺术图像对线条、图形、图案等数据图表常见元素的运用也不胜枚举,更不要提在现当代艺术史上直接呈现图表、图谱的创作了。”
其他类型的博物馆也大致如此,虽然具体呈现有所不同。就现在数据可视化技术的能力来看,做可视化的着眼点不应该仅仅放在展示上,而是如何鼓励观者通过数据去进行发现。发现,可以说是现在做博物馆数据可视化的一个关键词。“在视觉的层面建立起数据、图像与世界之间更为清晰、完整和广泛的联系,并进行知识生产,塑造思维认知。这不失为一种现代的诉求。”
鼓励发现,引导发现,由发现产生价值,并由此促使博物馆数字化建设向博物馆核心业务渗透,最终成为博物馆业务整体转型的推手,这就是博物馆数据可视化的意义之所在。
“当信息成为博物馆收藏、研究、展示和传播的关键要素的时候,数字化更直接将信息或数据置于博物馆的核心”。这段话可以用来解释在数字化建设中引入数据可视化乃至数字人文的原因。
数字人文作为人文科学领域的一种新实践,能够使数据资源、技术与人文研究深度融合。数字人文在博物馆的应用,将为博物馆的各项业务提供新的强劲推力,尤其是促进博物馆传播拓展新的边界和产生新的思维。而且随着人工智能技术的成熟,数字人文的应用还将逐步丰富博物馆研究的方法论体系,使知识内涵显性化,拓展博物馆研究人员的学术视野,为研究范式的转变提供新思路。
可视化技术是构成数字人文技术体系和直观形象的极其重要的一环。
它对数字人文比较和发布功能的实现具有不可替代的作用。
因此,如果一个博物馆对自身要求较高,对数字产品注重知识的体系化与多层次挖掘,看重多维度、广视角的表现,需要有较高的立意和更高的观察视野,那么,数据可视化就是一个不错的选择。
四、上海博物馆在数据可视化的探索
上海博物馆从数字化建设伊始,就将内容建设放在首位,同时依据艺术博物馆的定位,追求内容和形式的统一。随着数字化建设的逐步深入,以及对数字产品理解程度的逐步提高,数据可视化技术逐渐进入我们的视野,并应用到实践中,取得了一些成果,当然也有不少教训。
单纯从可视化角度而言,对它的关注是从设计开始的。国内博物馆的数字化建设存在着两个明显的短板,一个是内容,另一个就是设计。设计的粗陋让很多博物馆的数字产品陷入了让人不忍卒视的窘境。
2015年上海博物馆官网改版,我们在新官网页面设计中引入了形象识别系统的整体设计概念,采用流行的扁平化设计风格。新颖的美术和配色风格得到了广大网民的认可。
由此,我们在内容和设计并重这条路上慢慢开始蹒跚学步,努力前行。近年来,随着数字人文理念的引入,数据可视化的方法开始在上海博物馆得到应用。
其中的代表性作品是2017年制作的网展“遗我双鲤鱼:馆藏明代吴门书画家书札精品展”,2018年完成的上海博物馆数字中心项目及其子项目——董其昌数字人文项目。
上海博物馆官网首页
馆藏明代吴门书画家书札精品展
“遗我双鲤鱼:馆藏明代吴门书画家书札精品展”是上海博物馆在2017年所做的一个非常有特色的实体展。
这个只有49封书札组成的小型展览办得亦小亦美,风生水起。我们的团队在经过研议以后,决定以数据可视化作为突破口,充分利用互联网的多元化特点,以生活为切入点,争取把明代文人及其书札作品的多面性展现出来。
我们选取了两个入口:关键词入口和人物关系入口。关键词入口是从书札中选取贴近生活的语句做成,名为“见字如面”,人物关系入口则是与此次书札展涉及的人物的关系网络图相连而成,名为“云中谁寄锦书来”。
无论是关键词还是人物关系入口的设置,都是缘于书札内容价值的一种数据可视化的表现。
“见字如面”版块是源于数字人文中常用的词频分析方法而形成的设计思路。
“云中谁寄锦书来”则是网络关系矩阵的一种视觉化表现。
在策划这个网展时,我们都注意到了策展人手绘和注释的人物关系表,这个关系表已经在展场得到了应用。
由于通信双方的关系涉及书札内容的解读,也关系到人物和时代背景的印证,所以梳理和展现这整个关系网络的重要性不言而喻。
但是,单纯复制原有的以线性表达的人物关系图不足以让普通观众看懂。
从数据可视化的角度来看,必须利用数字技术去解构学术高度,进而采取一种更美观通俗的表达。
最终我们引入李清照《一剪梅》的词意,对应吴门文人灿若星空的意向,利用“数字人文”的理念构建了一幅可视化互动关系图。
在页面上,每一颗闪烁的“星星”都代表着一位文人巨星,点击“星星”,便可一键穿越走进明代吴门文人的生活交游圈,阅读他们的私人通信,得见他们有血有肉的日常生活。
“见字如面”界面
吴门星空人物网络关系图
上海博物馆数字中心项目及其子项目
2018年5月上海博物馆数据中心项目初步建成。
它是以数据可视化为主要展现手段,以博物馆学为依据开发的一个数据分析和管理系统,涵盖了博物馆收藏、研究、传播三项主要业务功能,融合了博物馆业务工作的基本流程,并对博物馆的主要业务数据进行了一定的科学挖掘和定量分析,通过可视化的形式予以表达,以期根据博物馆的定位与目标,为博物馆管理从“经验驱动”到“数据驱动”做好前期准备。
对应博物馆的主要功能,该系统的设计分为人、馆、物三大版块,通过互联网入口、现场服务入口及馆内局域网入口等多种来源实现数据汇集,达到俯瞰式的数据观测效果,准确及时、全面综合地反映博物馆的实时运行状况。
可以预期的是,通过对上述各种数据的长期累积,多维度分析,获得博物馆公众服务效应的数据画像,得到博物馆传播的趋势性预测,将为博物馆实施基于馆藏和观众需求的精准服务产生重要的评估及决策依据。
这一切,也都是基于数据可视化的基础上的。
上海博物馆数字中心综合页界面
上海博物馆数字中心观众服务数据界面
在建成数据中心的同时,上海博物馆还进行了另外一个非常重要的尝试,即在国内博物馆界率先实行了数字人文项目的实践。
这一项目依托本馆丰富的藏品资源和雄厚的研究基础,试图打通藏品基本数据和研究数据壁垒,试探以数字化技术辅助传统的器物研究。
这一项目以明代著名书画家董其昌为基点,同时以西方艺术的发展作为参照物,围绕着文人活动这一中心,在数字人文方法上以社会网络关系和历史地理信息作为两个主要立足点,辅之以人工智能技术的应用,从相关的收藏、艺术流变、人际关系等多个层面,依靠数据关联和量化分析,以可见的形式展现与董其昌相关的时、地、人、事。
项目首先确立了一个原则,即从专业研究人员关注不多的一些人文脉络,来展现董其昌对于书画艺术的认知过程、画艺精进的心路历程,以及收藏鉴赏的文人趣味。
根据董其昌年谱、著述等文本资料及遗留作品,逐步梳理出对其书画生涯产生影响的鉴藏、交友、纪游、传承等多个人文脉络,首次以可视化的形态为董其昌的研究设计了一个“主体—表达—时代”的综合维度,从而为进一步探索董其昌的各种身份和相关表达,以及这些身份和表达与时代事件之间是如何彼此展开、相互作用的等诸多原本模糊不清的问题的研究,在数字形态上打下一个良好的基础。
如何将数据以尽可能美观易懂的可视化效果展示给观众,是这个项目的重要内容之一。
利用Python、Gephi可视化工具绘制董其昌的大事作品年表等,并预留了与中国历史人物传记资料库(CBDB)、开放式中国历史地图集等接口。在可视化工具的呈现下,与董其昌相关的数据得到了有效的组合,并被赋予了新的视角,满足了观众在数据中寻求发现的欲望。
作品可视化版块则是对董其昌的书画作品予以介绍和分析。
在这一版块中尝试引入最新的机器学习技术,以人工智能方式分析中国古代绘画的元素级特征,构成素材数据抓取和聚类的自动化模式。
通过算法的调优,目前已初步提取了山、树、房、亭、矾头、船等数十类特征元素上千个。
为进一步自动图像聚类分析、相似度匹配等应用提供了精准的数据基础。
董其昌大事年表可视化界面
机器标注与学习结果
总之,对于博物馆数字化建设来说,数据可视化是其中不可或缺的一部分。
展示数据的力量,通过数据去引导发现,在发现过程中形成创造,并以创造成果造福于社会,这才是博物馆数据可视化的意义所在,也是博物馆融入新时代,应对新形势应有的勇气和担当。当然,这将是一个长期的、循序渐进的过程。
本文改编自《博物馆数据可视化的探索与实践——以上海博物馆数字化建设为例》,原文刊载于《博物院》2019年第2期(总第14期)。作者:刘健 上海博物馆。
《博物院》杂志2019年第2期
《博物院》杂志
《博物院》杂志是由中国科学院主管,科学出版社主办,首都博物馆、天津博物馆、河北博物院共同协办的国家级博物馆行业期刊。
该刊主要栏目有:专题探索、理论研究、博物馆实践,涵盖与博物馆相关的以下学术研究成果:
博物馆学理论与博物馆史;藏品征集与保管;藏品修复与保护;藏品研究;展览与展评;博物馆教育;宣传与文创;博物馆管理;开放与安保;博物馆建筑;博物馆数字化与信息化;专著与论文述评;与博物馆相关的历史与考古研究、古建筑和古遗址的保护与研究及其他相关研究成果。