Skip to main content

大量のデータを活用するということ

2017年3月1日 更新


データ活用の現状

2045年には、人工知能(以下、AI)が人間を超える(技術的特異点を迎える)と予測されています(出典:レイ・カーツワイル「ポスト・ヒューマン誕生 コンピューターが人類の知性を超えるとき」)。機能的な範囲や、評価尺度など様々な見解はありますが、今後30年程度で実現するのでしょう。AIを進化させる大きな要素のひとつはデータから知識を獲得する技術です。知識の元となるデータの総量は、2年で10倍に増えていると言われており、蓄積されるデータ量の増大と、データから知識を獲得する技術の進化が並行して進んでいます。

データの増加に合わせて、様々な事象が予測できるようになり、メカニズムが解き明かされて行くでしょう。これは未来の話ではなく、装置の故障予測やマーケティングのための顧客理解など、私たちの身近で現在行われているデータ活用も、局所的なAIであり、大量のデータから知識を得ることです。

自分の会社には、設備や故障、顧客の行動などを理解できるだけのデータが蓄積されているかと気になるのでしたら、ぜひとも試してください。数年前とは比較にならないほどのデータが蓄積され、活用されることを待っています。

技術的なポイントを簡単に説明すると、下図のようになります。

データから知識やルールを得るプロセス

[図1 データから知識やルールを得るプロセス]

データが少ない状況では、事象に精通した専門家(画像解析や品質管理などのプロ)のノウハウから知識やルールを作ろうとしていました。

大量のデータがある状況では、 (1) 事象の断片(特徴)をデータから抽出すること、 (2) 抽出した断片(特徴)から事象についての知識やルールを得て精度を検証すること、の2つのプロセスにより機械的に知識やルールを得ることができるようになりました。

(1) は、データをそのまま使うのではなく、データ同士を組み合わせて2次データを作ることで、データに含まれているはずの事象の断片(特徴)を遍く取り出します。 (2) は、各種のアルゴリズムを使い、また各アルゴリズムの動作条件を変えながら、何通りもの知識やルールを作って精度を検定します。これら (1) (2) を探索的に繰り返しています。

無駄な計算をしていると感じるでしょうが、あらゆる可能性を探索的にやり尽くして、最終的に最も有効であったデータやアルゴリズムは、ほとんどのケースで、事前に想定していたものと異なります。データが大量になると、人間には有効なデータやアルゴリズムを選ぶことができないと考えるべきです。知識やルールはデータから求めるべきであり、これこそが大量のデータを保有することの意義なのです。

主要な技術は以前から研究されていました。ここ数年の間に、大量のデータに対応できるよう技術が洗練され、計算機のパワーも増大し、探索的なアプローチが実現できるようになってきました。

データ活用のコツ

このような状況にある現在、企業や組織としてどのようにデータを活用して行くべきかについて、当社の「FUJITSU Intelligent Data Service データキュレーションサービス」(以下、データキュレーションサービス)を通して見えてきたことを述べます。

一番大切なことにデータを活用する

テーマ選定のコツは、現状で一番大切なテーマに対して、データで解くべき問題を作ることにあります。

最初は、影響の少ない業務や判断に対して、データ活用を試みることがスモールスタートと考えている場合があります。しかし、傍流の業務に関するデータは、量も質も十分でないことが多く、良い結果は期待できません。

データで解くべき問題の考え方

[図2 データで解くべき問題の考え方]

また、ビジネスから見た必要性は重要です。例えば、「故障」という事象を予測するようなデータ活用モデルを作り、その後でビジネスモデルを検討することは非効率です。図2にあるように、故障という事象は人間が理解やノウハウ蓄積のために使用してきた中間的な単位であり、同じ故障であっても原因や対処が複数存在するため、適用するためには相応の業務検討が必要となります。

状態と結果に関する大量のデータを結び付けて、「部品Aの最適な交換タイミング」のような保守作業を直接的に予測するモデルを作れば、ビジネス適用や評価が正確かつ迅速に行えます。

経営や事業戦略の中核の一端にデータを据えて、競争力を強化したり新しいやり方を作り出そうと決めたりすることで、データ活用がスタートするのです。

自社に合ったデータのマネジメントを構築する

データは経営資源であると言われていますが、データ価値向上、データ価値のビジネス活用の考え方、組織、リソースなどの検討が十分とは言えません。検討するために必要となるデータ活用実績や共有が不十分であるために、有効な検討ができないためと思われます。

データ活用を始めて、作成したデータ活用モデルの精度、そのモデルを使ったビジネスの評価をすることで、データ活用のサイクルを運営する組織や仕組み、何を内製化し、何を外部リソースにするか、必要とする分析環境などが、徐々に明確になって行きます。データ活用を通して、自社に最適なデータマネジメントを構築してください。

データキュレーションサービスの特徴

データキュレーションサービス(図3)は、データ活用の専門家(当社ではキュレーターと呼ぶ=データサイエンティスト)が、探索的アプローチでデータ活用モデルを作成するサービスです。

データキュレーションサービスの概要

[図3 データキュレーションサービスの概要]

現在、約80のプロジェクトで利用されており、下記のような事例があげられます。

  • ID-POSを中心に外部要因のデータを使って、顧客の来店を予測する
  • 組立てラインを構成する各装置のログデータと出荷後品質データから、生産品質の指標を作り直す
  • 今まではマーケティングがあまり必要ではなかったB2Bや社会インフラ系企業で、社内の各種データからユーザ理解や行動予測のマーケティングモデルを作る

データ活用には下図のような段階があります。データキュレーションサービスによるデータ活用モデル作成のみでなく、必要に応じて、ビジネス検討や適用のための基盤まで含めた提案も可能です。

データ活用のステップ

[図4 データ活用のステップ]

ビッグデータ活用を考えている方に向けて、考え方や活用の始め方に関連することをお伝えしましたが、データキュレーションサービスでは、すでに予測モデル等を利用しているお客様からの精度向上の依頼や、自社で分析チームを立ち上げたいお客様からの人材育成の依頼なども受けています。

全数データとパネルデータの融合がより良い暮らしの提案を支援

2013年、ICTサービス最大手の富士通と広告業界最大手の電通は、ビッグデータを活用したマーケティング領域の事業で協業を発表しました。ICTベンダーと広告代理店、他業界同士の協業が何を目的として何を生み出そうとしているのかをご紹介します。

AI・機械学習の魅力とワナ

多くの企業や自治体で、具体的にビッグデータの活用が進んでいますが、これらの多くの事例で利用されている技術に人工知能(AI)・機械学習があります。本稿では、AI・機械学習の魅力とワナを紹介し、今後の展望を述べます。

生活者の声を業務に活かすSNSソリューション

膨大なソーシャルメディアデータを分析することで、様々な業務に変革をもたらすことが可能です。観光、災害、マーケティング、教育など、業種・業務ごとの活用について、事例を交えご紹介します。

参考資料

富士通のビッグデータに関するお問い合わせ・ご相談

Webでのお問い合わせ

入力フォーム

当社はセキュリティ保護の観点からSSL技術を使用しております。

お電話でのお問い合わせ

0120-933-200 富士通コンタクトライン(総合窓口)

受付時間 9時~17時30分
(土曜・日曜・祝日・当社指定の休業日を除く)