摘 要 :
为了满足人们查询文化遗产图像的需求 ,本文设计并实现了北京文化遗产图像检索系统(CHIR)。
系统充分地考虑了文化遗产图像的特点,如分类特征明显 、颜色分块特征明显等 。对核心的分块颜色直方图算法进行了改进 ,并将基于关键字、类别 、颜色直方图、改进分块颜色直方图及形状持征的检索方法相结合 。
系统不仅具有很好的检索效果,而且具有友好的人机交互界面 、快速高效的检索方式,能够很方便地浏览检索结果。
文中给出了整个检索系统的架构 、实现方法和系统实现的功能。
随着互联网的广泛应用及信息检索需求的快速增长,人们对信息检索工具以及网络的依赖越来越强, 并且规模与复杂性日益加强。信息检索技术的应用已经渗透到人们生活的各个方面。
文化遗产图像检索系统的实现是文化遗产数字化保护的一项重要内容,对于以科技 、人文为主题的2008北京奥运,宣传中国文化 ,具有重大意义。
一方面,基于内容的图像检索技术已成为目前多媒体 、信息检索 、人工智能 、数据库等领域共同关注的一个重要的研究领域。
比较流行的CBIR方式是通过例子的查询和相关反馈技术查找到与例子图像在视觉内容上比较相似的图像 ,按相似度大小排列返回给用 户。
在文化遗产图像检索系统中,研究基于内容的图像检索技术成为必然 。
本文针对文化遗产图像具有分类特征明显、颜色分块特征明显的特点 ,重点对分块颜色直方图算法进行了改进 ,使它更好地服务于文 化遗产图像检索系统。 另一方面,用户的交互接口是多媒体系统中最重要的方面之一 。
在实际的图像检索应用系统中。人们不仅关注检索的准确性 ,而且关注检索是否便捷和易懂 。
一个操作简单 、直观的用户交互接口使得检索系统在实际应用中更能受到人们的青睐 ,被人们广泛使用 、 本文针对文化遗产图像特征,重点改进了核心算法 ,并将图像全局颜色直方图 、改进分块颜色直方图以及形状特征有机结合 ,设计并实现了北京文化遗产图像检索系统。
本系统具有友好的人机交互界面、方便快捷的检索方式 ,检索结果能较好地接近人的视觉感知结果 ,检索效率能达到实际应用的要求。
一、系统结构设计
系统结合了关键字检索 、基于图像全局颜色直方图特征的检索 、基于改进的图像分块颜色直方图特征的检索以及基于图像形状特征的检 索4种方法来满足用户对北京文化遗产图像的检索需求。
用户可以通过输入关键字检索相关的景点或文物 ,也可以通过上传任意一幅示例图像 ,来查找相似的文化遗产图像。系统提供了友好的查询界面,高效的、实时的特征提取算法及匹配算法 。
整个系统分为用户交互接口、特征提取模块 、相似性匹配模块 、数据库访问模块及检索结果显示模块。
北京文化遗产图像检索系统 (CHIR)结构图如图 1所示:
1)、用户交互接口
以文本和示例检索以及用户自定义查询等方式向用户提供查询接口,系统提供了基于文本 、全局颜色直方图 、分块颜色直方图及形状特征和多种特征综合的查询方式。
2)、实时提取特征模块
提取用户要查找的示例图像对应于用户自定义查询的特征。
3)、数据库访问模块
主要负责图像库和图像特征库的管理和连接访问操作,并负责特征库与图像库中对应图像的一致性访问。
4)、相似性匹配模块
利用特征之间的距离函数进行相似性匹配研制了基于全局颜色直方图 、改进的分块颜色直方图和形状特征等检索箅法,可以有效地进行图像检索 。
5)、检索结果显示模块
用来将检索的结果按相似性大小返回到浏览器端。
二、特征提取及检索技术
1、文本特征提取及检索
用交互接口形状特征检索结果显示浏览器检索条相似性配返同特征服务器数据库访问。
基于关键字的检索为最早期的检索技术 ,也是经常被使用的一种检索方式,但由于这种检索方式在前期对图像库中的图像进行的手工标注具有很大的主观性 ,不能满足不同人对相同图像的检索需求,因此在一般的图像检索系统中不被采用。
本文所设计的北京文化遗产图像检索系统属于一种专业检索系统 ,检索的对象是北京各大景点 、景观等文化遗产图像 ,这些图像具有明确的名称、所属景点等特性,用户在检索过程中,可能的需求有 :
1)、基于景点名称的检索:
如天坛、北海等。
2)、基于景点类别的检索:
如塔 、碑等 ;
3)、对某景点内特定景观的检索:
如天坛祈年殿、故宫、乾清宫等。
在本系统基于关键字的检索中,并不需要提供一个宽泛的检索就能满足人们对北京文化遗产图像检索的一般需求。
系统提供基于景点名称 、景点类别和具体景观的图像检索。
对于每幅图片我们按“具体景观名称景观类别所在景点名称”格式进行手工标注,如:“白云观三官殿殿白云观 ”,“乾清宫外景殿故宫”,“鹅池碑亭亭陶然亭”等 。
2、颜色特征提取及检索