GTM-W5W3BK9
Skip to main content
  1. 首页 >
  2. 关于富士通 >
  3. 公共信息 >
  4. 新闻 >
  5. 新闻存档 >
  6. 2008年 >
  7. 互联网评价信息监控高速化技术的开发

互联网评价信息监控高速化技术的开发

株式会社富士通研究所,富士通研究开发中心有限公司

北京, 2008-11-19

株式会社富士通研究所(1)与富士通研究开发中心有限公司(2)成功开发了一种能够实时监控发表在BBS、博客、SNS(社会性网络服务)等网络媒体上的海量、多样化的信息,并收集到有关企业及商品的评价信息的技术。应用本技术,企业能够迅速地对应网上流言引起的风险。

开发背景

企业在积极推进CSR(Corporate Social Responsibility)的过程中,为了即时掌握企业以及商品的口碑信息,并采取相应行动,避免由于品牌形象的降低和社会信用的丧失所导致的经营危 机,评价信息风险管理变得越来越重要。特别是,由于互联网的评价信息是即时地向非特定的多数人传播,如果不能及时的对评价信息采取对策,就有可能导致风险 管理失败,造成重大的经营损失。因此,怎样迅速监控网络上的评价信息,是评价信息风险管理中最重要的课题之一。

问题

到目前为止,利用CGM (Consumer Generated Media)分析服务(3)的评价监控,有以下几个问题:

  1. 数据的前处理
    以往的技术,为了分析数据,必须进行建立索引(4)等前处理。因此从评价发表后到被发现最短需要几十分钟、几小时,有时甚至要一天以上。
  2. 高速监控大量且多样的评价模式
    为了得到评价信息,要使用包括与评价信息相关的企业名和商品名以及评价中涉及的“不满”、“故障”等评价词的模式。以往的技术,由于具有检出时间与评价模式(想知道有无评价信息的企业名及商品名等,以及评价词语的出现模式)的数量成正比的特点,要无遗漏地高速地监控超过几十万条海量、多样化的评价信息十分困难,而且每次所能够监控的评价模式数量也有限制。

新技术

为了解决上面的几个问题,我们开发了独立的对文本数据流(5)一次性监控多个模式的技术,成功地实现对海量、多样化的评价信息进行实时监控。此技术的特长如下所示(图1)。

  1. 不需要前处理的实时监控技术
    这次我们开发的实时监控技术,不需要对网络上不断发布的评价信息进行诸如建立索引等前处理,而是通过实时监控处理技术,实时地监控出与事先登录的评价模式相符的文章。这样,就能够大大缩短了从评价信息发布到被系统发现所需的时间。
  2. 一次性监控大量且多样化评价信息的技术
    本技术的性能不依赖于输入模式的数量,通过高速的模式匹配算法(6),一次性监控海量、多样化的评价信息。另外,对于使用通配符及指定文字间分隔的字符数等这种以前难以实现高速监控的复杂模式,也能在不降低性能的情况下进行高速的监控。这样,关于企业及商品的评价信息就能够没有遗漏地被监控到。
1119

图1. 评价信息监控技术

效果

根据我公司的实验结果,此技术至少能达到比现存系统高出数百倍的速度。实验证明,本技术对于10万条评价模式,平均每条互联网文章的监控时间不足0.1毫秒(Intel®Xeon® 3.8GHz的机器上)。另外,1条评价模式与10万条评价模式的性能差别不足0.2% 。

通过本技术,网络上的大量且多样化的评价信息能够实时地被监控到。另外,本技术还有希望被应用于发现网络上的垃圾博客和预告犯罪等方面。

今后的应用前景

目前此技术已预定于本年度应用到富士通(中国)信息系统有有限公司(7)(FCH)的CGM分析服务上。另外,将其用于早期发现口碑意见领袖(8)的工作也在进行中。


  • [1] 株式会社富士通研究所

    社长 村野和雄,总部地址:日本神奈川县川崎市。

  • [2] 富士通研究开发中心有限公司

    董事长 吉川诚一,所在地:中国北京市。略称FRDC (Fujitsu Research and Development Center Co.,Ltd)。

  • [3] CGM (Consumer Generated Media)分析服务

    对消费者发表在博客、BBS、SNS等网络媒体中的企业及商品信息进行分析,可视化的服务的总称。

  • [4] 建立索引

    为了检索文本数据而构筑的索引结构。为了统计数据要所有的单词(以及短的字符串),其构建需要时间。

  • [5] 文本数据流

    照原样排列大量的文本数据。

  • [6] 模式匹配算法

    在文本数据中,判定文本数据中是否出现某个模式的计算程序。例如,对文本数据D=cocoa进行如模式P1=co在D中出现了两次,模式P2=ca在D中没有出现等诸如此类的判断。

  • [7] 富士通(中国)信息系统有限公司

    董事长 五十岚隆,本社:中国上海市。略称FCH (Fujitsu (China) Holdings Co., Ltd.)。

  • [8] 口碑意见领袖

    影响很多人的CGM制作者。

关于Fujitsu(富士通)集团

Fujitsu(富士通)是世界领先的面向全球市场提供行业解决方案的IT综合服务供应商。Fujitsu(富士通)有大约16万名员工遍布全球70多个国家为客户提供技术支持服务,Fujitsu(富士通)把世界各地的系统服务专家、高度可靠的计算通讯产品和先进的微电子技术结合起来,带给客户更多的附加价值。富士通集团总部设在东京(东京证券交易所上市代码:6702),截至2008年3月31日财政年度结束时报告的合并收益为5.3兆日元(530亿美元)。
如需更多资讯,请浏览:http://www.fujitsu.com

信息技术研究部

电话: 电话: 010-5969-1536
邮箱: 邮箱:yu@cn.fujitsu.com
公司:富士通研究开发中心有限公司

日期: 2008-11-19
城市: 北京
公司: 株式会社富士通研究所, 富士通研究开发中心有限公司