GTM-W5W3BK9
Skip to main content
  1. 首页 >
  2. 关于富士通 >
  3. 公共信息 >
  4. 新闻 >
  5. 新闻存档 >
  6. 2007年 >
  7. 成功开发出通过中文博客进行评价分析的技术

成功开发出通过中文博客进行评价分析的技术

株式会社富士通研究所,富士通研究开发中心有限公司

2007-01-23

株式会社富士通研究所(以下称为富士通研究所(1))与富士通研究开发中心有限公司(以下简称FRDC(2))成功地开发出了从中文博客和论坛等大量文档内容中抽取对企业及其产品的评价信息的技术。该技术不单纯地局限于评价信息的正面或者负面,而且能够基于网上消费者行动模型-AIDEES模型(3)进行分析。

该技术尤其对已经进入中国市场,或者准备进入中国市场的日资企业,能够为其提供中国市场中相关企业及其产品的辅助分析。

开发背景

正如“Web2.0”一词所代表的那样,用户对网络服务的积极利用正成为时代的趋势。其中,博客、论坛、SNS(Social Network Service)等用户可以发布信息的媒体CGM(Consumer Generated Media(4))正在迅速普及,商家们也积极地尝试着如何将这些媒体上的内容活用于商务之中。富士通研究所开发出了对CGM的文章进行自动解析,从中筛选出评价信息,并利用AIDEES模型进行分析的技术。Nifty株式会社(以下Nifty(5))已经把它作为一项市场服务“BuzzPulse”(6),于2006年4月起推向市场。

另一方面,随着日资企业进入中国市场,越来越多的企业希望对日本国内的和在华企业以及其产品的评价进行定量的分析。据了解,中国国内的博客数量正在逐年增加,目前约有770万人 (2006年8月、CNNIC调查)。因此,不仅针对日本的CGM,对以中国的CGM为对象的评价分析技术的需求也越来越大。

0123_1

图1 语言相关部分和语言不相关部分的切分

已开发技术

关于中文CGM评价分析技术,首先,根据语言相关部分和不相关将富士通研究所开发的评价信息分析处理模块进行了划分。(图1)

对于语言相关的部分,富士通研究所与FRDC合作,使用已开发完成的形态素解析(单词切分技术)和正面负面等评价用语的词典生成的中文处理技术,并把在日本开发的AIDEES模型进行了汉化。对于汉化,也不是单纯的日语翻译,追加了中文特有的评价表达方式,以及对AIDEES模型的各部分相关的表现形式。此外,在复旦大学(7)和华中师范大学(8)语言资源监视研究中心等中国国内的专业语言处理机构的协作下,成功地提高了评价信息的分析精确度。

效果

以日资企业比较活跃的,同时博客和论坛发言比较多的汽车行业的相关数据为中心收集了数以万计的页面内容,生成了中文评价分析系统。以图表的形式展现不同时间里企业和汽车的正面或负面等评价信息,同时可以将频繁出现的评价作出列表(图2)。还可以对多个企业、多种车型间不同的评价信息,用容易比较的形式进行可视化。另外还实现了以相对明了的形式可视化地比较多个企业和车种间的评价差异(图3,背景颜色深的关键词为负面评价,颜色浅的则是正面评价。线条越粗表示使用的关键词就越多。)。

利用此功能,可以对日本和中国同时上市的车种的评价,在日本市场、中国市场的品牌形象等进行实时比较,还可以对应AIDEES模型的各部分采取不同对策,从而实现面向全球市场的品牌分析的应用。

0123_2

图2 某汽车生产厂家评判分析的时间系列变化图

今后

在中国国内的大型ISP公司搜狐公司的协助下,高效地收集上亿个中文CGM,并开展汽车行业以外的CGM数据分析。此外,将此次开发的技术应用于@Nifty的“BuzzPulse”,并探讨以在华日资企业为对象的市场服务。同时,还打算进行英文等中文以外语言(多语言化)的开发。

0123_3

图3 三家汽车生产厂家评价的关键词集的可视化示例


  • [1] 注1

    株式会社富士通研究所代表取缔役社长 村野和雄,本社: 神奈川县川崎市。

  • [2] 注2

    富士通研究开发中心有限公司董事長 吉川誠一,所在地: 中国北京市。简称FRDC (Fujitsu Research and Development Center CO., LTD.)。1998年成立。

  • [3] 注3

    AIDEES模型以Marunouchi Brand Forum代表的片平秀贵氏提倡的CGM为前提的消费者 行为模型。Attention(认知), Interest(关心), Desire(欲求), Experience(经验), Enthusiasm(热诚), Share(共享)等消费者行为的第一个字母连接而成的。

  • [4] 注4

    CGM (Consumer Generated Media)博客和论坛等消费者创造的媒体的总称。

  • [5] 注5

    Nifty株式会社董事长 古河建纯,总部: 东京都品川区,http://www.nifty.com/

  • [6] 注6

    BuzzPulse面向企业的、支持以博客为中心的网络媒体的评价分析和咨询的市场服务。(2006年3月30日发表 http://www.nifty.com/buzz/)

  • [7] 注7

    复旦大学校长 王生洪,所在地: 中国上海市。http://www.fudan.edu.cn/

  • [8] 注8

    华中师范大学国家语言资源监测与研究中心 校长 马敏, 所在地: 中国湖北省武汉市。http://pop.clr.org.cn

  • [9] 注9

    捜狐公司 (Sohu.com Inc.)CEO: 张朝阳,所在地: 中国北京市。 http://www.sohu.com, http://www.sogou.com

电话: 电话: 044-754-2652(直拨)
邮箱: 邮箱:pr-wom@ml.labs.fujitsu.com
公司:株式会社富士通研究所
智能研究中心

电话: 电话: 010-8458-4558
邮箱: 邮箱:pr-wom@cn.fujitsu.com
公司:富士通研究开发中心有限公司

新闻ID: 2007-01-23
日期: 2007-01-23
公司: 株式会社富士通研究所, 富士通研究开发中心有限公司