Skip to main content

Fujitsu

English | 日本語

China

存档内容

注意:该页面为存档页面,其内容可能已过时。

基于Linked Data的中文企业知识图谱构建技术

富士通研究开发中心有限公司

2015-02-09

富士通研究开发中心有限公司(1)开 发了一种中文企业知识图谱构建技术。该技术基于Linked Data标准对异构的企业数据进行集成,首先利用跨语言模式匹配技术将企业数据模式与标准元数据模式建立映射关系,然后通过知识校验技术进行企业数据融 合,最后利用实体链接技术将互联网知识库与企业知识库进行关联。

和传统的数据集成技术相比,我们的技术不但能够有效 地在数据层集成企业数据,同时还可以集成更丰富的语义层数据,赋予企业数据更多的语义描述信息。另外,该技术还支持多语言企业数据的集成,以及企业知识与 外部知识的关联。基于Linked Data的中文企业知识图谱技术能够给企业提供更加智能高效的数据管理解决方案,同时为企业决策提供更丰富的知识支撑。

【 开发背景 】

企业知识图谱是高效组织、管理、共享企业数据的关键 基础架构之一。企业对构建本组织知识的图谱有着十分迫切的需求。然而企业数据的异构性,数据冲突和不一致,数据缺乏语义描述等问题为构建企业知识图谱带来 巨大挑战。针对以上问题,我们提出的基于Linked Data的中文企业知识图谱构建技术能够有效满足上述企业数据组织管理的需求。

【 课题 】

传统数据集成方法是将分布在多个数据库中的数据合 并,该方法通常是一种内部数据在数据层的集成,没有使用标准元数据模式对企业数据进行语义描述。因此企业数据不能很好地与外部知识库进行关联,从而阻碍了 企业利用外部知识进行决策。同时,传统数据集成方法不能很好地解决数据冲突和多语言数据集成的问题。如何保证企业内部知识与外部知识库的关联,以及企业数 据模式与标准元数据模式的关联是衡量数据集成算法性能的一个重要标志。

【 开发的方法 】

基于Linked Data的中文企业知识图谱构建技术包括跨语言模式匹配技术,知识校验技术和外部知识库关联技术。图一是跨语言模式匹配技术示例。该技术可以将企业内部数 据库的模式(中文)与标准元数据模式(英文)进行映射。优点是企业数据可以继承元数据模式的语义信息,同时,标准元数据模式有利于企业数据高效地集成和共 享。

图一:跨语言模式匹配技术示意图

图二显示的是知识校验技术,当数据源A,B,C发生冲突,通过数据源的权威度,数据的冗余度,数据间的一致性和语义约束确定最可靠的数据值,并将多数据源进行融合。

0209-2
图二:知识校验技术示例

图三显示的是知识关联技术,包括企业内部知识关联和互联网知识(DBPedia, GeoNames)的关联。企业数据与互联网知识库关联后就可以使用更丰富的外部知识,辅助企业决策。

0209-3
图三:知识关联技术示例

【 将来 】

富士通研究开发中心有限公司将与合作伙伴一起向中国企业推广企业数据图谱构建技术,并根据客户的反馈进行技术的改善和提高。

【 关于商标 】

所提及的制品名等专有名词为各社的商标或注册商标。

【 注释 】


  • [1] 基于Linked Data的中文企业知识图谱构建技术

    富士通研究开发中心有限公司:董事长 佐佐木繁。总公司地址:中国北京市。

关于Fujitsu(富士通)集团

Fujitsu(富士通)是世界领先的日本信息通信技术(ICT)企业,提供全方位的技术产品、解决方案和服务。在全球拥有约162,000名员工,客户 遍布世界100多个国家。我们凭借在ICT领域的丰富经验和实力,致力于与客户携手共创美好的未来社会。富士通集团(东京证券交易所上市代码:6702) 截至2014年3月31日财政年度的合并收益为4.8兆日元(460亿美元)。
如需更多资讯,请浏览:http://www.fujitsu.com

关于富士通研究开发中心

富士通研究开发中心有限公司是日本富士通株式会社投资440万美元在中国境内设立的第一家独资法人研发机构。公司的研究领域覆盖了富士通株式会社的所有业务范围,即信息处理、通信、半导体和软件服务4大领域。
公司成立于1998年2月,公司的经营范围涉及多媒体系统的硬件、软件、半导体元器件与材料的技术开发和技术转让,提供相关的技术服务与咨询。
如需更多资讯,请浏览:http://www.fujitsu.com/cn/frdc/

技术联络

电话: 电话: 010-59691538(直拨)
邮箱: 邮箱:sunjun@cn.fujitsu.com
公司:富士通研究开发中心有限公司
信息技术研究部

日期: 2015-02-09
公司: 富士通研究开发中心有限公司