2007-01-23
株式会社富士通研究所
富士通研究开发中心有限公司
2007年1月23日 — 株式会社富士通研究所(以下称为富士通研究所、注1)与富士通研究开发中心有限公司(以下简称FRDC、注2)成功地开发出了从中文博客和论坛等大量文档内容中抽取对企业及其产品的评价信息的技术。该技术不单纯地局限于评价信息的正面或者负面,而且能够基于网上消费者行动模型-AIDEES模型(注3)进行分析。
该技术尤其对已经进入中国市场,或者准备进入中国市场的日资企业,能够为其提供中国市场中相关企业及其产品的辅助分析。
正如“Web2.0”一词所代表的那样,用户对网络服务的积极利用正成为时代的趋势。其中,博客、论坛、SNS(Social Network Service)等用户可以发布信息的媒体CGM(Consumer Generated Media 注4)正在迅速普及,商家们也积极地尝试着如何将这些媒体上的内容活用于商务之中。富士通研究所开发出了对CGM的文章进行自动解析,从中筛选出评价信息,并利用AIDEES模型进行分析的技术。Nifty株式会社(以下Nifty,注5)已经把它作为一项市场服务“BuzzPulse”(注6),于2006年4月起推向市场。
另一方面,随着日资企业进入中国市场,越来越多的企业希望对日本国内的和在华企业以及其产品的评价进行定量的分析。据了解,中国国内的博客数量正在逐年增加,目前约有770万人 (2006年8月、CNNIC调查)。因此,不仅针对日本的CGM,对以中国的CGM为对象的评价分析技术的需求也越来越大。

图1 语言相关部分和语言不相关部分的切分
关于中文CGM评价分析技术,首先,根据语言相关部分和不相关将富士通研究所开发的评价信息分析处理模块进行了划分。(图1)
对于语言相关的部分,富士通研究所与FRDC合作,使用已开发完成的形态素解析(单词切分技术)和正面负面等评价用语的词典生成的中文处理技术,并把在日本开发的AIDEES模型进行了汉化。对于汉化,也不是单纯的日语翻译,追加了中文特有的评价表达方式,以及对AIDEES模型的各部分相关的表现形式。此外,在复旦大学和华中师范大学语言资源监视研究中心等中国国内的专业语言处理机构的协作下,成功地提高了评价信息的分析精确度。
以日资企业比较活跃的,同时博客和论坛发言比较多的汽车行业的相关数据为中心收集了数以万计的页面内容,生成了中文评价分析系统。以图表的形式展现不同时间里企业和汽车的正面或负面等评价信息,同时可以将频繁出现的评价作出列表(图2)。还可以对多个企业、多种车型间不同的评价信息,用容易比较的形式进行可视化。另外还实现了以相对明了的形式可视化地比较多个企业和车种间的评价差异(图3,背景颜色深的关键词为负面评价,颜色浅的则是正面评价。线条越粗表示使用的关键词就越多。)。
利用此功能,可以对日本和中国同时上市的车种的评价,在日本市场、中国市场的品牌形象等进行实时比较,还可以对应AIDEES模型的各部分采取不同对策,从而实现面向全球市场的品牌分析的应用。

图2 某汽车生产厂家评判分析的时间系列变化图
在中国国内的大型ISP公司搜狐公司的协助下,高效地收集上亿个中文CGM,并开展汽车行业以外的CGM数据分析。此外,将此次开发的技术应用于@Nifty的“BuzzPulse”,并探讨以在华日资企业为对象的市场服务。同时,还打算进行英文等中文以外语言(多语言化)的开发。

图3 三家汽车生产厂家评价的关键词集的可视化示例
株式会社富士通研究所
智能研究中心
电话: 044-754-2652(直拨)
电邮:pr-wom@ml.labs.fujitsu.com
富士通研究开发中心有限公司
电话: 010-8458-4558
电邮:pr-wom@cn.fujitsu.com