【概要】
各种各样的图像和视频库正变得越来越庞大,如何对他们进行方便的操作和检索就成为一个亟待解决的重要问题。图像不同于文本,因此,传统的基于文本的检索技术不能满足这种要求。在这种情况下,我们开发了多媒体信息检索和分类系统(MIRACLES)。
【解决方案】
MIRACLES系统采用不同的策略分别处理静态图像和动态视频,对静态图像,主要利用三种特征:颜色分布、纹理和形状。先从图像中抽取出相应的特征向量,计算出它们之间的距离。接着,利用自组织映射(SOM)的方法,根据这些图像之间的距离把它们排列在一个三维的空间中,从而使得相似的图像被放置在相邻的区域。针对于网络应用,MIRACLES采用了文本与图像相结合的方式,即根据某个特定的关键字,由一个Robot将网络上相关的文本和图像提取出来;然后,利用图像特征对这些图像进行排列。这样,用户在检索图像的同时,可以方便的得到与这个图像相关的文本及其URL地址。
利用视频分割技术,MIRACLES可以将一段视频中的关键帧及音频变化提取出来,使得用户不必浏览整个视频,仅根据关键帧就可以定位到感兴趣的内容。
【技术要点】
【概要图】
岩见田
于浩
刘汝杰