「支える」技術
Chain Data Lineage

何ができるようになるもの?
企業や個人が持っているデータを、自社・他社・個人で活用することを「データの利活用(利用&活用)」と言います。しかし、手に入れたデータが信頼できるかどうか(例えば、個人情報ならば当人の同意が得られているのかどうか等)は、データだけを見てもわかりません。そこで開発したのが、Chain Data Lineage技術です。これにより、利用者は安心してデータを利活用できるようになります。
「Chain Data Lineage」という言葉の意味は?
Chainは「鎖」「チェーン」、Dataは「データ」、Lineageは「血統」「系統」「家柄」という意味です。
「Lineage(血統)」って聞くと、こんな感じの図を想像しますね!
このような血統と今回の技術ってどうつながるのかしら??
「使いたいデータが「どこで発生して、どのように加工されて現在の状態になったのか」という過去の経緯を明確に示すことができるのが、Chain Data Lineage技術です。つまり「データの血統のようなもの」ということで、この名前が付けられています。
なるほど!
どうしてChain Data Lineageが必要なの?
インターネット上に公開される企業や個人のデータが増えています。それは「データの利活用」を進めて、発展していきましょう、という気運が高まっているからです。
「データ利活用」って聞いたことあります!でも私のまわりで実際に使っている人いるかしら??
企業や個人が手に入れることのできるデータは、実際に使おう!としても安全かどうかわかりません。その不安があるために、活用をためらってしまうことが多いんです。
なぜ不安なのですか?
例えば、目の前にあるデータがどのように加工されてきたものなのか、誰の手を経てここまで届いたのかわからなかったりします。また、個人情報が含まれている場合は、本人の同意を得ていることがはっきりしていなければなりませんが不明確だと不安ですよね。
不安な状態では、データを使いづらいですね。もったいないけど・・・
はい、そこでデータが「信頼できるもの」ということを目に見えるように示すことで、活用したい人が安心してデータを使える仕組み「Chain Data Lineage」を富士通で開発しました!
どうやって公開データを安心して使えるようにしているの?
基本となっているのは、「ブロックチェーン」の仕組みです。
ブロックチェーンは、金融などでの取引記録をネットワーク上の複数のコンピュータで共有し、検証して、正しい記録を蓄積する仕組みですよね。代表的なのはビットコインですね。
はい。ブロックチェーンでは、データ本体からある規則に従って算出する数字の列「ハッシュ値」を使います。データが改ざんされるとそのハッシュ値が変わります。
- *ハッシュ値=データから算出した値(パスワードのようなもの)のため、データを変更するとハッシュ値も自動的に変わる。
つまり、ブロックチェーンに記録されているハッシュ値と再計算したデータのハッシュ値が「一致」していればそのデータは改ざんされていない、ってことになるので安心して使えるってことですね!
はい、更に「誰がどういう加工・合成したか(加工情報)」 「データ提供者の同意があるのか、ないのか」等の途中経過の情報もわかれば、(他者データを利活用したい場合でも) 信頼できるデータとして扱えますね。
富士通の強み(1)企業をまたいだデータ来歴管理技術(ハッシュ・チェーン技術)
来歴ってなんですか?
この場合は、データの生成・加工履歴などの情報のことです。
来歴管理技術っていうのは、データがどのように伝わっていったかを管理する技術ってことですね!でも、それはブロックチェーンで、「ハッシュ値」を使って改ざんの有無を確認できることと何が違うのですか?
ブロックチェーンでは「ハッシュ値」を使って改ざんを防いでいましたね。今回の来歴管理技術を使うと、利活用したいデータの加工履歴をたどることができます。
ん?つまりどういうことですか?
Chain Data Lineageでは、加工履歴も含めたすべて来歴情報を記録し、ひとつ前の工程の来歴情報のハッシュ値を今の来歴情報に含めるようにしています。これにより、すべての工程の来歴情報のハッシュ値がチェーン状につながった形で保持されています。
ハッシュ値の中には、加工情報も含まれるので、すべての来歴情報をたどることができるんですね!信頼性UP♪
富士通の強み(2)同意管理技術
「同意管理技術」って何ですか?
個人情報が含まれるデータを活用したい時、データ提供者本人の同意を得ているのか確認する必要があります。
それは大変な作業ですよね。データ量が多ければ多いほど確認作業が増えるってことだから・・・。
はい。そこで窓口でデータ提供者から同意を得て、その後は 同意の有無を一元管理し、同意済のデータ提供者の中から、さらにデータ利用会社が希望する年代・性別などの属性条件に合致する個人データのみを簡単にで確認できるようにしました!
- ・同意管理の一元化が可能!!
- ・データを管理しているデータ提供会社の工数削減!
- ・同意の証拠を残すことで、安全な個人データ流通を実現!
事例① 保険 ~運転履歴を基に個人にカスタマイズした自動車保険を提供~
現在、車を運転している人は、年に一度更新時期に保険の詳細条件を自分で確認して契約をしています。詳細条件とは、使用目的として通勤か一般使用か、距離、使用者、免許証の色のことなどです。しかし今後は、車を運転情報の多様化(自家用車の運転履歴だけでなく、レンタカーやカーシェアサービスを利用した時の情報)を含めて保険料を査定するようになるかもしれません。その際、保険料の査定資料となるデータの生成・加工・取引プロセスなど、全体を目で見えるようにし、何か問題があれば問題箇所を特定できるようになるのがChain Data Lineageです。
事例② 医療 ~患者のデータを、安心で確実な創薬研究に提供~
患者のデータ(今までの診察記録やどんな薬でどのような結果が表れたか等)を大学や研究機関が利活用し、その大学や研究機関がおこなった分析を創薬メーカーが新薬開発に利活用します。その際、患者の個人情報が含まれるデータについては、個々人のデータ提供への同意の有無の確認が必要になります。その際、Chain Data Lineageの同意管理機能が活躍します。
関連リンク
プレスリリース
技術紹介
- (技術者インタビュー)
安心・安全なデータ流通の仕組みで企業や人々が新たな価値を創造できる世界へ - (雑誌FUJITSU Vol.70)
業種業界を越えたデータ流通の信頼性を向上させるChain Data Lineage - (FUJITSU JOURNAL)
深刻化するサイバー攻撃の脅威、AIやブロックチェーン技術で創る「信頼」とは