“文化遗产数字化应用平台”的技术构建。

        引言


       中国具有光辉灿烂的悠久历史, 数千年的文明发展史为中华民族乃至世界人民留下 了许多弥足珍贵的文化遗产。其中有以珍稀文物和名胜古迹为代表的有形物质文化遗产, 也有以诗歌、史诗、神话、传说、舞蹈和仪式 等为代表的无形非物质文化遗产, 这些文化遗产博大精深, 具有浓郁的中华民族特色。


       云南少数民族是中国多民族的一个缩影, 其文化是中国文化的重要组成部分, 其中“丽江古城”已成为世界文化遗产, 云南的哀牢山脉梯田、纳西族摩梭人母系制会、云南文山的岩洞住宅村等, 都具备了申报世界文化遗产的条件。


      云南有五座城市是国家级历史文化名城, 云南元谋人遗址、澄江出土的古文物和石林出土的80万年前的旧石器等都是研究人类文明的活化石。这些文化遗产是世界上罕见的民族文化宝库, 备受世界关注, 具有世界性特征。


       利用现代数字技术保护、抢救、挖掘、制作、展示和传播文化遗产是目前国内外研究的 热点, 也是加快我国文化产业建设的重点。


       伴随着信息技术的迅猛发展, 文化遗产的数字化提到了推动社会经济发展的重要议事日程。


       其概念就是将文化遗产通过技术手段转换成数字化形态, 充分应用IT技术对其进行数字勘探、挖掘, 使其重现和再生, 并通过多媒体数据库技术得以永久保存后, 利用互联网向世界传 播。


       近年来, 国内外世界遗产和世界文化遗产数字化已有了较大发展, 研究思路和技术随着当今计算机技术特别是数字音/视频、互联网技术和虚拟现实技术不断进步而发展。


       例如美国的“American Memory”计划将主要历史档案资料, 转换为数字格式, 包括各种类型的信息资源, 如图书、册子、手稿、特殊 印刷品、音乐、声音记 录、照片、 动画等。


       法国的虚拟卢浮宫实现了对展室的虚拟漫游。


       中国的“数字敦煌 ”、“数字故宫 ”采 取了数字虚拟现实技术, 对文物、壁画、建筑、藏品和档案等遗产进行模拟与复原, 达到深入研究和生动展示的目的。


        可以说, 数字技术通过“比特 ”描绘出某一民族的“文化基因图谱”, 以数字技术整理文化遗产就如同建立其“文化特征基因库”, 从而形成一个民族文化的虚拟世界, 其语言、文字、风俗、宗教、性格、气质和心态、遗址和建筑物、装饰和服装、生产和生活习惯等都能生动、形象和细致地反映出来, 并可融入到现实文化生活 中。


       目前, 文化遗产数字化建设、管理和发布的技术条件日趋成熟, 诸如激光测量与三维扫描、三维虚拟场景的人机交互、计算机图形学、数字音 /视频、基于内容的多媒体检索、多媒体数据库存储、IP网络流媒体、多媒体加密与数字水印技术等。


       数字化应用技术是实现文化遗产数字化的有效途径, 但由于文化遗产规模大, 技术要求高, 而相关标准建设相对滞后, 因而国内在这方面的应用实际上还处于探索阶段。基于以上思考, 本文结合承担云南科技计划项目的同时, 重点就少数民族文化遗产数字化应用中的平台构建等关键技术问题进行研究和探讨。



       2、 遗产数字化平台的构建


       少数民族文化遗产数字化平台的构建, 是依托数字信息网络环境, 通过以特定的数字技术进行采 集、制作、存储、传输 和发布方式, 对现有和潜在的少数民族文化遗产进行组织、利用、 管理的实现过程。


       具体可划分为少数民族文化遗产的采集和数字化技术应用两个方面。



1.png

1 是应用平台的结构及流程。



       少数民族文化遗产的采集将从历史的回溯、文化类型联系的纵横向比较、区域范围的内外 关系、文化遗产影响力等方面 去探寻信息源, 经过科学比较、鉴别、选择而确立少数民族文化遗产的代表性信息, 再通过 分类、核实、过滤、分析和汇集为立体数据系统提供数字化制作的素材。


       对于云南少数民族文化遗产的分布规模涉及省内25个少数民 族共1449. 9万人, 其中白、哈尼、傣、傈僳、佤、拉祜、纳西、景颇、布朗、普米、怒、德昂、 独龙、基诺等15个民族为云南所特有, 覆盖了历史、源流、民俗、文学、艺术、民居、文物、名胜、象形文字、方 言等方面, 有活态和遗存两种形式的文化遗产。


       采集资料包括各方专家对文化遗产的研究成果, 反映遗产产生, 使用等学术的、艺术的、感觉的、甚至感情与宗教的非实体性资料, 还包 括对云南原始生态村落进行的专题研究资料。


      少数民族文化在册文物数以万计, 已经公开展出的文物只占其中的极少数, 由于温度、湿度和 场地等条件的限制, 大多数文物可能永远不 能与普通观众见面, 有些文物由于保护的需要不能安装照明设备, 即使能展示, 观众也无法看清楚细节。还有些抢救出来的经书档案已经部分焚毁, 不能被翻阅。


        前期大量的工作还包括数字化、非数字化信息以及相关知识的信息分类、索引和管理策略等。


       数字化应用技术首先对文化遗产的各类信息进行数字化记录, 通过模拟、制作和创建使文化遗产的内容复原并重现, 因此而形成大量的文 字资料、图像资料、声音解说、配乐、视频 和 2D, 3D 模型等信息集, 应用多媒体数据库对数字化的资料进行永久和高效的管理, 最后通过网络多媒体发布技术实现文化遗产的广泛传播和利用。


       虚拟现实技术是用声、光、电一体化的信息产品形式表现出来的, 利用信息技术、三维扫描技术和高精度摄像系统, 可大量地获取文物和景观遗址的三维图像与数据, 并生成物体与场景的三维全景模 型 就一种虚拟现实或虚拟环境, 实现交互式观赏功能, 满足用户主动参与的要求, 是少数民族文化遗产保护中重要的数字化技术。


       文字资料的数字化由于文字的复制性较强并可应用OCR识别技术, 实现技术相对简单。


       图像资料的数字化采用数字图像压缩技术可以较好地实现, JPG JPEG2000 格式 等, 用数码相机进行实物实景拍摄, 或采用扫描仪从印刷精美的文物类书籍图册中获得数字化图片。声音解说、配乐等音频资料采用数字音频压 缩格式数字化采集制作。


       视频采用最新运动图像数字编码 MPEG-4 进行压缩和保存, 主要使用数字摄像机和全景摄像机实地拍摄, 后期制作使用非线性编软件进 行, 或由计算机2D, 3D 生成文化遗产原始风貌和人文景观, 特别在重现和展示非物质形态的文化遗产中有不可替代的作用。在虚拟现实制作 过程中产生的图片、音 /视频素材也 纳入多媒体 数据库的管理范畴, 建模产生的数字文件采用工具本身的格式保存。


       文化遗产数字化资料的利用主要由具有资料的存储管理和检索导航功能的多媒体数据库管理系统来实现, 与一般的文本数据库不同的是多媒体数据库要解决多媒体数据编目和多媒体数据的元数据描述规范。由互联网的多媒体信息发布系统来完成文化遗产的内容传播。




        3 应用平台构建中的关键技术


       文化遗产数字化应用平台的构建涉及的关键技术有多媒体信息数据采集、VR 制作、元数据、编目、检索、存储管理与发布等, 这里介绍的是多媒体数据库设计、元数据设计、存储管理和发布应用。




       3. 1 文化遗产多媒体数据库设计


       数字化技术的应用把各种文化遗产资料统一为 计算机数据, 形成的文化遗产多媒体数据资料具有方便存储、检索、低成本、无差错和方便传播的优点。目前有数据仓库、数据集市及数据挖掘等数字化处理方法, 采用数据库管理数字资料需要从多媒体信息编目、著录、标引、元数据和索引的设计入手, 研究适合文化遗产的电子文档、图像和音 /视频的多媒体数据库管理方案。


       数据库构建是数字资料管理的核心, 提供多媒体信息的录入、检索、修改以及输出等基本功能, 为文化遗产展示虚拟场景漫游和信息发布网站 提供数据支持。少数民族文化遗产的数据库设计分为后台数据库和前台数据库。


        后台数据库由图形数据库、音 /视频数 据库和 文档数 据库三者构成。

        这是数字化的后台中心数据库, 由图形部分、二维平面图像、三维立体图像信息和音 /视频文件组成。

       后台数据库面向整个内部局域网, 与数字采集、编辑 和制作 共享资 源。基于数据库的图片管理, 除了图片浏览功能, 还支持元数据著 录项的 各种属性检索; 由于基于数据库管理, 因此可以进行大量的图片管理, 检 索速度快; 基于缩略图的组织管理, 可快速浏览。


        基于数据库的音 /视频管理包括少数民族文化遗产 的音 /视 频资料和数字化作品的数据库管理。其功能有保存、注释、视频索引 查询 和原始资料回放等。利用元数据的“关联数字资源”字段对于视 频资料存储小尺寸、高压缩率的 MPEG-4 视频索 引作为视频内容简介, 提供了音 /视频浏览功能, 支持帧定位。这样就建立了面向遗产对象的音 /视频管理模式, 从而将相关的图像、解说词、字幕、同期声文件、内容介绍、关键帧等, 通过附件方式关联 到节目对象中, 方便内容的检索和利用。


       前台数据库是后台数据库的简化, 分别响应不同的用户访 问, 负责遗产数字资料的分 发和发 布应用, 包括将数据库中原始图像和音/视频素材进行处理后的珍品动态库, 存放当前服务功能信息的服务动态库, /视频索引库以及少数民族文化专题动态库等。


       前台数据库的设计既提高了检索处理的响应速度, 又加强了后台数据库的安全性。



       3. 2 文化遗产数字资料元数据设计


      元数据作为一个在信息组织、管理和服务领域的重要概念与工具, 已经日益得到关注和应用。

       国际上先进的有关元数据 的一些理论与方法, 目前正在从接受、学习和研究走 向实际应, 在国内数字资源建设的实践中, 有些系统内置了不同完善程度的元数据方案, 但针对音 /视 频资源的元数据方案并不多见, 而少数民族文化遗产数字化资 料主要是大量的多媒体数据。


      本方案建立在文化遗产的电子 文献、数字图片、计算机2D3D 制作、数字 音 频、数字音/视频的节目、片段、场景和镜头等九种电子 资料的基础上。为了使用简便, 设计不同资源有不同的元数据模板, 每一种元数据模板的界面只包含这一 种类型资源所需要的修饰词, 在满足各种类型数字资料描述需要的同时易于实现。


        元数据编目和著录遵照DC、电子资源格式代 码( Internet Media Type, IMT) 、统一资源标志URI( RFC 2396) DCMI Period、日期与时间格式 ( W3CDTF) 、《广播电视音像资料编目 规 范》和《广播电视节目资料分类法 》。


        数字资料的标引数据可以通过多种途径( 系统自动获取、手工录入) 、分阶段 ( 数字化时立即标引、数字化后添加、入库再编辑 ) 实现。编目按功能可划分为自动和手动两种。自动编目定义编目模板, 具有编目匹配功能, 通过提高编目程度来提高编目速度, 此外提供音/视频关键帧检测和整理功 能, 基于 XML 文件格式标准的设计对编目信息数据交换。例如, 对于较为复杂的数字音 /视频资料, 通过文字标引、著录和附件信息, 结合视频低码流和关键帧技术, 实现数字音 /视频资料元数据的描述需要同时易于实现。



2.png


       说明音/视频资料著录项目分割为节目层、片段层、场景层和镜头层四层结构, 分不同的元数据项进行编目。


       其中, 描述节目层和片段层的数据元素就是表 1 的所有列项, 描述场景层和镜头层的数据元素用数字资料题名、主题、数字资料说明、数 字资料制作日期、数字资料数据格式和关联数字资料六个元素来进行编目即可。


      上述设计的优点是:


       ①、采用DC元数据集为基本框架, 符合国际元数据标准化发展趋势;

       ②、格式设置 HTML 语言的标签, 为每个单元增加著录标志, 从而实现输出结果为网络产品, 保留资料著录标志系统的功能, 适于互联网环境;

       ③、采用模板设计极大地简化了数字资料的著录和标引, 非专业编目人员也能掌握使用;

       ④、符合国内外有关编目规则的规 范, 对内容的标引深度没有限制, 并全方位支持中文全文检索;

       ⑤、 具有可扩展性, 可以与其他元数据单元连接使用。


3.png


        3. 3 存储管理设计


       文化遗产数字资料存储管理首先 是设计具有管理各种类型的数据格式的能力, 其次存储设计采用基于 SAN 的存储网络环境下, 以在线存储、近线存储、离线存储共同构成三级存储模式, 并在数据库中对数字资料在存储模式中的位置进行记录 和提示, 存储管理模块集成到多媒体数据库中, 实现灵活快速、 大容量、可平滑升级的存储机制。


        存储管理由存储服务器和索引服务器组成, 包括上载模块 ( 负责对多媒体数据进行管理, 将 音/视频文件和元数据信息上载到存储服务器) , 存储管理模块和索引管理模块。在提供高性能的数据访问和集中管理能力的同时, 降低了存储系统的单位存储成本。


      在实际应用中较好地满足大规模文化遗产数字视频资料海量存储的需要, 又可随着信息量的增长保证系统的可扩充性和拓容性。

      常用的资料可以从磁带、光盘迁移到硬盘中, 再由应用系统将数据传送到目的地; 同时要将硬盘上不常用的数据迁移到磁带中。




       3. 4 网络发布设计


       文化遗产数字资料发布阶段是再利用过程, 在前面各阶段 的基础上通过查询手段, 将文化遗产数字资料提取出来, 通过网络渠道进行传播。网络发布由内容分发系统和发布系统构成。


       内容分发系统是存储与发布系统之间的桥梁, 由分发服务 器和管理服务器, 以及内容分发模块和分发管理模块组成。

       支持多级或多个边缘发布点, 在分发管理模块的控制下, 通过 Web 创作将文化遗产的数字化资料分发到各发布点上。


       分发管理模块将依据分发策略, 智能、自动、手动、定时地向各发布点的检索服务器复制相关索引信息, 并同步控制内容分发模块将相关文化遗产数字资料分发到各发布点上, 同时把得到的元数据保存到相应种类元数据的数据库中。


       发布系统由索引服务器、播放服务器和 Web服务器, 以及相应模块组成, 采用J2EE 架构和 XML 标准, 以及IP 流媒体发布技术。

       功能包括元数据检索、全文检索、文化遗产内容检索 ( 如图片、视频的文化内容检索) , 动态抽取视频关键帧图片和索引视频等。

       用于发布的信息可以是 直接从多媒体数据库中提取的内容, 也可以是利用所提取的资料再次组装后而发布的, 形成具有可定制的专题资料 库, 多个数字资产逻辑集合就形成文化遗产的复合资产。


       在服务器上对视频文件进行搜索操作与真正的视频流发布不完全相同, 一旦许多用户同时选择了在线点播视频 节目, 那么服务器将面临巨大的资源占用压 力。


       解决方法是采用专用的存储机制来处理系统的视频数据, 并对服务器的 I/ O 性能进行优化, 使得系统具有处理多路视频 流并行发布的能力。视频服务器提供基于URL 访问视频 数据 的服务时, 服务器可在指 定时间 偏移处 开始播 放视频, 其基本原理是采用元数据中所包含的 时间戳信息来指定需 要播放时间的偏移量, 也就是在URL地址中指定视频信息 的逻辑位置, 在搜索系统中形成一个包含有视频数据的 URL 地 址, 以及关于时间偏移量的附加信息。



      4 结束语


       文化遗产是一个民族的精神财富, 用数字化来保存各种形态的少数民族文化遗产, 目的在于解决少数民族文化遗产缺乏长久保存, 缺乏重现, 缺乏跨区域、跨国界的交流和展 示, 缺乏系统性全息表现, 缺乏从作品上升到具有知识产权商品等诸多方面的问题, 通过网络技术, 可以将所有的文物资源 统一整合起来, 实现文化“一次加工, 多次利 用”, 全面地向社会传播, 达到教育、研究和欣赏的目的。


       除本文所探讨的应用技术外, 还有一些其他技术可应用于文化遗产的数字化, 例如, 在少数民族文化遗产信息系统基础上, 利用3G 技术构建文化遗产地理空间分析模型, 可更精确并且动态地掌握少数民族文化遗产的规模、分布和保护等信息。


       对于很多特殊文字, 字库里没有, 造成客户端浏览困难, 需要结合图形技术一并处理。

       对于内容的检索需要不断集成最新的数字图像、数字音 /视频压缩和检索方面的技术, 以提高对整个文化内容管理的性能, 使在线资料最大化, 检索、响应时间最小化。


       由于各种数字资料的编辑软件更新速度非常快, 因而原始资料的保存不宜对某一软件依赖性太强, 否则大量数据会因软件的淘汰而无法使 用, 这将造成巨大的损失, 要尽可能兼顾到以后的适容性。


       基于文化遗产数 字化的开放性传播, 使得从网络上下载文化遗产数字化信息十分方便, 这是少数民族文化遗产数字化应用的一大特点, 但 同时也带来了版权等问题, 应用数字水印技术可以加强文物的版权保护。


       另外, 互联网上的文化传播是面向世界用户的, 其相关的作( ) 品在设计时, 应考虑到中文版、英文版两种及更多语言的版本, 以利于最大限度地实现文化产品的学习、旅游、欣 赏、科研、教育的社会传播属性。






Copyright 2015-2035 西安越影信息技术有限公司 YUEYINGIT.COM | 陕ICP备2020016252号-1
客服QQ:58155571
Top