数字大学、智慧高校 | 美国高校图书馆大数据服务实践研究及启示。

       关键词:大数据;高校图书馆;服务转型


       摘要:文章根据大数据背景下,美国高校图书馆尝试服务转型,并以雪城大学、斯坦福大学为例,雪城大学应用大数据技术收集社交媒体信息,预测2016年总统大选;斯坦福大学参与社会互联网信息与电子邮件保存、整合与管理的实践,体现了在大数据时代美国高校图书馆服务的转型新趋势,为国内高校图书馆的服务创新及转型发展提供了经验。


    中图分类号:G250. 74
    文献标识码:A
    文章编号:1003 -1588(2016)07 -0122 -03


       随着信息技术的快速发展,现实物质世界不断被数据化,当物质世界完成数据化的构建及解读,人类即迈入智能时代。大数据时代催生了新的知识需求模式及管理模式,对图书馆行业产生了深刻影响。


       一方面,图书馆界加快了基于互联网、大数据技术的融合转型,开始运用互联网思维变革、创新服务,在合作、支持、外向发展的思维指导下,图书馆员开始日益关注如何更加有效地与研究人员开展合作,如何满足教师及社会大众的多元需求。


       另一方面,图书馆开始充分依托大数据技术,推动数字资源整合,提供深度服务。


       其服务模式包括:


       ①、通过馆藏资料的数字化和网络化加大馆藏资源的揭示力度,提供一站式服务,通过异构数字资源的融合、聚类和重组使资源从数据层的揭示与展现转向信息层、知识层的深度服务。


      ②、加强用户数据分析,实现个性服务。如:通过大数据分析精准预测单个用户信息需求模式及行为模式,推送服务。


      ③、参与互联网信息的采集、保存和服务。如:整理社交媒体信息,帮助社区理解主要的数据和信息资源,并利用数据构建智能社区。


       近日,美国图书馆协会主席萨莉·菲尔德曼在接受《高等教育纪事报》采访时以雪城大学图书馆的STACK(堆栈)项目等为例,展示了美国大学图书馆在大数据利用方面的示范作用。


       对国外大数据创新服务实践经验的研究能够为国内图书馆的服务转型提供参考和借鉴。




       1  、美国高校图书馆大数据服务实证研究


       1.1、雪城大学图书馆STACK项目


       大数据产业链与数据的生命周期密切相关,数据从产生、整合、处理、智能分析,最后与创新服务的结合应用,构成了大数据完整的产业链,而完整的大数据技术堆栈则相当于涵盖数据生命周期的大数据平台。


       通常的数据堆栈包括:


       ①、作为堆栈底层和基础的数据层。


       ②、发生数据准备、数据处理、数据转换和数据整合的整合层。


       ③、存储数据、对数据进行可视化、分析数据的分析层。


       ④、使用数据(包括历史数据、外部数据和实时数据)、业务规则和机器学习来进行预测及获取大数据价值的预测及规范分析层。


       从底部数据存储、操作、转换、基本分析发展到高级分析的预测,是大数据技术应用发展的必然。在数据堆栈技术的应用上,美国雪城大学iSchool走在了图书馆界的前列。


       STACK项目是雪城大学iSchool新开设BITSLab( Behavior,lnformation,Technology and Society行为、信息、技术、社会实验室)的第一个项目。


       作为雪城大学iSchool跨学科数字政治项目的分支,STACK项目具体运作如下:


       ①、开发STACK软件与Twitter、Facebook数据流、搜索工具的应用程序接口。


       ②、围绕36位竞选州长,展开大数据采集,这些信息包括在Twitter中被推送、加标签、关注、谈论的相关信息,在Facebook中被发布、喜欢、分享、追随的频次以及在Instragram、YouTube上的相关照片、视频等。


       ③、以Python格式语言将这些非结构化、半结构化数据存储在MongoDB NoSQL数据库中。


       ④、分析选民对各候选人的谈论及态度,各候选人的选举策略及选举圈内的信息传递、转移模式等。在开始运行的数周内,STACK项目就已经收集了超过70万条推特信息及大量脸书评论信息,每周项目组均会就大数据调研结果编写基本的定性分析报告,预测大选发展趋势及可能出现的新信息、新选情。在大选结束后,项目组还将围绕数据基础管理、大规模数据集处理、情感分析总结出一套协调化、多管齐下的大数据分析方案。


       1.2、斯坦福大学图书馆ePADD项目


       ePADD项目是斯坦福大学图书馆联合伊利诺伊大学香槟分校、哈佛大学、加利福尼亚大学图书馆及纽约城市图书馆委员会,通过合作开发支持电子邮件档案检索、采集、处理、评估、传递的开源软件,参与互联网信息的整合与管理,促进统一性国家数字平台的形成,这也是IMLS国家数字平台项目二阶段的子项目之一。


       2014年,斯坦福大学图书馆正式启动ePADD项目,一阶段的任务包括:针对资助者、档案工作者及研究人员所面临的电子邮件访问、管理等日常问题开发ePADD工具,利用自然语言处理、自动元数据处理及其他批处理技术,形成基于工作流的电子邮件档案管理,提升电子邮件中隐藏性文化遗产资源的能见度及可获取性。



       二阶段的任务包括:


       ①、发展ePADD评估、处理、搜索、传递关键功能模块,形成支持电子邮件存取的生态处理与T作流程系统,促进跨馆藏、跨机构的电子邮件发现与检索及对公众的可见性。


      ②、创建培育融合ePADD用户、开发者及充满活力的持久型社区,促进在eP-ADD使用基础上,整个社区的广泛参与与充分合作。ePADD项目是斯坦福大学图书馆以外向发展思维为指导,在充分合作基础上,参与互联网档案管理、挖掘电子邮件大数据价值的有益尝试。



       2、美国高校图书馆基于大数据的服务转型启示



       2.1、关注社区,以数据技术为驱动,助力图书馆转型


       信息技术迅速发展的大数据环境,无论是在资源建设、空间设计,还是在服务模式上,美国高校图书馆都在经历着转型,关注社区及以数据技术和资源为驱动,是其转型期的重要表现之一。



       2.1.1、关注社区。


       图书馆关注重点正经历由资源向人和社区的转变,如何将服务有效嵌入用户的T作、学习和科研实践中及如何促进用户对内容创建、制造等创新活动的参与,逐渐成为高校图书馆研究的重点。




        2.1.2、以数据技术和资源为驱动。


       图书馆的服务不再围绕资源和技术展开,而是以技术和资源为手段,通过发挥技术和资源的最大化效应,满足用户需求,辅助用户参与学习、创造活动,推动社区的学习和科研进程。


       资源数字化、服务网络化及管理知识化将是大数据时代图书馆的主要特点及转型升级的方向和目标,国内高校图书馆以大数据技术和大数据资源为驱动的服务转型应做好如下规划:


       ①、加快馆藏资源的数字化、网络化进程,利用元数据、数据关联技术打通数据,实施基于业务流程、揭示信息服务和发现并支持流程管理及数据统一管理的平台架构,建立统一、开源的数据仓储平台,推动数字资源的开放存取与反复、活化使用。


       ②、将大数据分析技术应用至用户需求分析、图书馆空间设计、服务设计的多个领域。


       ③、积极参与互联网信息大数据的保存、管理、分析及应用,在实现自身对社区参与、融合的同时,推动社会全面信息资源生态管理系统的构建。



Copyright 2015-2035 西安越影信息技术有限公司 YUEYINGIT.COM | 陕ICP备2020016252号-1
客服QQ:58155571
Top