「支える」技術
判断理由を説明できるAI技術

そもそもAIって?
AIは「Artificial(人工) Intelligence(知能)」の略です。AIは、人間にしかできなかった判断をコンピューターを中心とする人工的なシステムによって行えるようにしたものです。
AIの昔と今
おもしろいことに時代によってAIの意味が変わってきています。以前は「かな漢字変換(コンピューターに日本語を入力する方法のひとつ)」もAIと呼んでいました。 現在、その技術は当たり前になっているので、AIと呼びません。事前に教えられた事例を学習し(機械学習)、未知の事象についても判断・予測してくれるのがAIです。事前に決められた対応のみおこなうのは、AIとは考えられていません。
例えばどんなものがAI?

AIの頭脳には何がつまってるの?
AIはコンピューターを中心とする人工的なシステムです。コンピューター(サーバー)には、計算を行うプロセッサー(CPU)や記憶するメモリーがたくさん入っています。これらのシステムは、最初から役立つAIではなく、ほとんど何もしらない「赤ちゃん」 と同じです。コンピューターの中で、必要なデータを学習させ(機械学習)、うまく育てることができれば賢いAIになりますが、育て方を間違えると実用に堪えるものにはなりません。つまり、AIは「与えるデータ」と「学習方法」が重要です。
人の成長
見たり、聞いたり、本を読んだりして学習しながら成長します。

AIの成長
たくさんの電子データから学習して成長します。

AIはどんな風に判断しているの?
人間が何かを決める時
好きか嫌いか、正しいか間違っているか、判断した後どうなるか、周囲はどう思うかなど、それまでの知識や経験をもとに人間は判断しています。これが「学習」しているということです。
AIが何かを決める時
AIに物事を判断させるために、必要なデータを与えて経験を積ませないといけません。それを「機械学習」といいます。その機械学習の方法にもいくつか種類があります。そのひとつの「Deep Learning ディープラーニング(深層学習)」を説明します。
Deep Learningとは?
- スマートフォンに音声で質問すると、音声で回答してくれるサービス(音声認識)
- Webサイトの閲覧中、過去にチェックした動画や商品の関連情報などが表示される機能(人の行動の認識)
- 自動車の自動運転で障害物や標識を判別する技術(画像認識)
私たちの身近なところで、活躍しているんですね!
はい、様々な用途で活用が広がっていますが、まだ課題もあります。それはDeep Learningの判断した結果について「なぜその判断を出したのか」を説明するのが困難なのです。
なぜですか?
Deep Learningは、人間の神経細胞をモデルにした複雑な計算をおこなう「ニューラルネットワーク技術」を使います。画像やテキストなど大量のデータが入力された後、ネットワーク内部で発生する計算がとても複雑なので、その意味を人間が追跡するのが難しいのです。ひとつひとつの計算の意味がわからないので、計算の結果が出てもなぜ「その結果になったのか」は説明できません。
なんだか難しい話ですね。でもAIの判断理由を説明しなければいけない場合ってあるのですか?
はい、あります。例えば、自分の予想と違った時、人は「え、なんで?」となります。また、人には思いつかない結果が表示されたら、「なんでそうなるの?」となります。そのような時に、AIが出した判断の理由を説明できれば、人はAIの判断に安心できます。それはAIの信用にもつながります。
確かにそうですね。
AIの判断理由を説明できるようにする技術(開発技術)
富士通(研究所)で開発したAIの判断理由を説明できるようにする3つの技術について、具体的な例とともにご紹介します。
- ① Deep Tensor®(ディープテンソル)
- ② Knowledge Graph(ナレッジグラフ)
- ③ Wide Learning™(ワイドラーニング)
① Deep Tensor®(ディープテンソル)と ② Knowledge Graph(ナレッジグラフ)
→具体例:がんゲノム医療 治療開始までの時間短縮!
がんゲノム医療って聞いたことはありますが、よく知りません。
最近、テレビなどで注目されていますね。がんの原因となる遺伝子の変異に基づいて診断・治療を行う医療です。
なぜ「がん」の治療にゲノム医療が注目されているんですか?
同じ「胃がん」と診断された患者でも、変異している遺伝子が違えば、効果のある治療法や薬、副作用が異なる場合があります。「がんゲノム医療」とは、遺伝子情報をもとに、ひとりひとりの体質や病状に合わせて治療などを行う医療です。
すごいですね。
ただ、「がんゲノム医療」は、診察から治療開始までに時間がかかるので、時間短縮が課題となっています。
どうして「ゲノム医療」は、治療までに時間がかかってしまうのですか?
治療方針が決まるまでには、患者の遺伝子情報を「次世代シーケンサー」という装置で調べ、患者ごとに健康状態や治療歴などを考えてどういった治療が最適かを主治医は、遺伝医学・病理学など複数の専門医とともに会議を行っています。この期間が2週間と言われています。
進行性のがんの場合、1日でも早く治療を受けたいですよね。
そうですよね。そこでAIを使用して最適な治療法を推定させると、治療法の検討期間を1日に短縮にすることができます。しかし大事なのは、AIにより提案された治療法について、「なぜその治療法が良いのか」を主治医が理解し、納得する必要があります。
確かにそうですね。
富士通では以下の2つのAI技術を使って、治療開始までの時間短縮を目指しています。
具体的にどんな原理なのか教えてください。
はい、「次世代シーケンサー」で得られた遺伝子変異の情報をDeepTensor®(ディープテンソル)に入力します。すると、その情報はグラフ化されます。

遺伝子変異情報をニューラルネットワークを使って解析し、推定結果として2つのことが得られます。
1つ目は、遺伝子変異情報が病原性(がん等)を持っているかどうか
2つ目は、病原性を持っていると判断した場合、その判断に大きな影響を与えた情報を提示

次に、AIの出力結果に大きく影響した遺伝子変異の組み合わせ(複数)をKnowledge Graph(ナレッジグラフ)の1700万件の医療論文などのデータベースのようなものと照らし合わせ、その患者の症例に関連する資料を提示します。

Knowledge Graph(ナレッジグラフ)を使うのはインターネットの検索と何が違うんですか?
インターネットの検索は、ヒットした結果の中に検索キーワードと同じ単語が入っているものを結果として出します。Knowledge Graph(ナレッジグラフ)は、データベースの中の関連の大きい資料同士がすべてリンクされています。AIの結果に大きく影響を与えた遺伝子の関連資料を出力するだけでなく、その関連資料を読むための必要な資料も出力します。つまり AIによる提案結果の妥当性を説明するために必要で、人間が想定していなかった資料も提案してくれます。
スゴイ!! 近い将来、ゲノム医療が私たちの身近になりますね!
「Deep Tensor®(ディープテンソル)」技術は、「グラフデータ」を扱うのが得意な技術で、他の分野にも応用が期待されています。次に紹介するのは「表形式」を扱うことが得意な「Wide Learning™(ワイドラーニング)」技術です。

具体例をご紹介します。
③ Wide Learning™(ワイドラーニング)
→具体例:人気の進学塾、その秘訣とは!

的確なアドバイスで子供のやる気を出させてくれるなんて、保護者からすると塾に1番期待するところですよね。それに経験が浅い講師でもベテランの講師でも変わらずにアドバイスしてくれるってスゴイことですね!
その人気のある塾は、「③ Wide Learning™(ワイドラーニング)」というAIを取り入れていて、講師でも気づかなかったアドバイスを見つけることができます。そのアドバイスに至った理由もきちんと説明できるので、生徒も納得できて、やる気がでるんですよ!
理由も説明してもらえるなら、保護者も安心できますね。 具体的にはどんな風に判断・理由付けをしているのですか?
まずは塾生情報が入っているデータベースの色々な項目(科目毎の内申点や加点事項など)の組み合わせを調べます。そして、それらの条件と受験生の太郎君の情報を比較することによって、太郎君がどうすれば合格率が上がるのか、わかりやすく示すことができます。


今までと何が違うのですか?
従来は過去の塾生データをみて、講師(人)では気づけなかったことも、Wide Learning™(ワイドラーニング) は合格する確率が高い新たな条件(仮説)を発見することもあります。また、Wide Learning™ (ワイドラーニング)は何度やっても同じ結果(再現性)が出ますので、経験の浅い先生もベテランの先生も同じように的確なアドバイスが可能なのです。
どうしてWide Learning™(ワイドラーニング) だと気づけるんです?
私達は「可能性ある組み合わせ」をナレッジチャンクと呼んでいます。そのナレッジチャンクは、入力データが複雑になればなるほど増えます。 Wide Learning™(ワイドラーニング)は、たくさんのナレッジチャンクを網羅的に計算することで、重要な仮説を漏れなく発見します。

それじゃ、入力するデータが多いと組み合わせの数が爆発的に増えるから、計算が遅くなるんじゃないですか?
その通りです。総当たりで組み合わせを計算すると時間がいくらあっても足りません。総当たりは、入力データの「あり得ない組み合わせ」もすべて計算しています。例えば、男子校なのに、女子が志望した場合も計算します。
それは「あり得ない組み合わせ」ですね。
Wide Learning™ (ワイドラーニング)は、「あり得ない組み合わせ」を計算しません。他にも、過去に合格した生徒はいない条件の場合なども、合格率が低いので「あり得ない組み合わせ」として計算しません。このような「あり得ない組み合わせ」をすばやく発見できるのが、富士通技術の強みです。
「可能性のある組み合わせ」だけを計算するから、結果を早く出せるのですね。
Wide Learning™ (ワイドラーニング)は、中学⽣から研究者まで、幅広いユーザーの方々にご理解・ご活用いただけるように、解説コンテンツやTrial Tool(体験ツール)を⽤意しています。「Hello, Wide Learning!」実際に試してみよう!
こんなところで大活躍を期待(新たなサービス)
機械学習技術を使って、早期の実用化を考えているサービスの例です。
低頻度の事象の判断やAIの透明性が必要な業務
1)医療診断 疾患の早期発見 ⇒ 早期治療開始
2)業績や経済指標から企業の成長を予測 ⇒ 株式選定上昇銘柄を判定
3)毎日の出力結果から重大障害を検知 ⇒ システム保守
4)センサーデータから製品異常判定 ⇒ 生産機器故障の予兆検知
5)セールスプロモーション 潜在顧客の発見 ⇒ 売上向上
5)使用頻度・額からクレジットカード取引異常を発見 ⇒ 不正使用の判断
小話 ゲノムって?
私たち人間を含めたあらゆる生き物が、それぞれの生命活動を営むために必要とする遺伝情報のひとそろい。それをゲノムと呼んでいます。Gene(遺伝子)とchromosome(染色体)から合成された言葉なんですよ。では、ゲノムは、どのような「言葉」で記述されている情報なのでしょうか? ゲノムは、DNA分子の中に、文字(塩基:アデニン(A)とグアニン(G)、シトシン(C)とチミン(T))が並んだ「文字列」として記されています。この4種類の「文字」(塩基)が対になって列を作って、遺伝情報を保っています。人間の遺伝情報(ヒトゲノム)を構成するDNAは、約32億もの文字列(塩基配列)から成り立っています。

ヒトゲノムの塩基配列を調べる研究は、1990年に始まりました。そして、2003年に、その約32億の配列のうち99%の解析が済みました。この解析結果を元に、がんや感染症などの診断、予防、治療法など様々な研究が始まっています。ヒトゲノムの全塩基配列の解析作業が進んだのは、実は、コンピュータ(計算機)の性能が飛躍的に向上したおかげでもあると言われています。

関連リンク
Deep Tensor® & Knowledge Graph
- 【東京大学医科学研究所様】がんゲノム医療を加速するAI技術を開発
- AIを使った「がんゲノム医療」で、がん治療を加速する
- 信用リスク判定など金融業務のデジタル化を加速する「説明可能なAI」
- AIの推定理由や根拠を説明する技術を開発
Wide Learning™
- Hello, Wide Learning!
- 最適なアクションプランを提案、「Wide Learning」の新技術を開発
- 30年以上のノウハウと最先端の技術を擁し「人に信頼され、社会を発展させるAI」の開発を目指す
- 正解が少ないデータでも高精度に学習するAIの新技術「Wide Learning」を開発
その他