Document to Structure

  • 化学文献からデータを自動的に抽出します。
  • 化学名から構造式への変換をサポートします。
  • 構造式から多様な化学名への変換もサポート。

製品概要

PDFなどの文書から構造情報を高速に抽出し、論文・特許解析を加速

化学ドキュメントまたはデータはさまざまな形で、さまざまな場所に存在します。 またそれらの化学文献、内部レポート、特許情報などは、名称、構造形式、画像形式など複数のフォーマットで表現され、情報の抽出をより困難にします。 Chemaxonの化学テキストマイニング技術は、さまざまな非構造リソースから全ての化学データを抽出・統合され、構造化されたナレッジベースを構築するためのソリューションを提供します。

特長

ドキュメントから化学情報を自動抽出

  • Chemaxon独自の技術による高い構造変換率と正確性で化学ドキュメントの自動的なマイニングを実現します。
  • 抽出位置情報(ページ、コンテキスト)も含めて取得され、文献の管理など、効率的な情報の検索を可能とします。

D2Sで変換できる文章フォーマット

  • PDF(Text PDF, Non-searchable PDF)、TXT、HTMLXML、Microsoft Officeドキュメント(DOC, DOCX, PPT, PPTX, XLS, XLSX)など、幅広いドキュメントファイル形式の読み込みをサポートします。

化学名を構造情報に変換 - Name to Structure

  • 化学名(IUPAC名、一般名、商品名など)やCAS番号、SMILES、InChIなどの文字列から化学構造式に変換することができる機能です。
  • 名称の他、辞書機能も搭載されており、自社化合物IDからの変換もサポートします。

構造情報から化学名称に変換 - Structure to Name

  • 構造情報から各種化学情報への変換もサポートします。
  • さまざまなソフトウェアを介して、化学情報の読み込み・閲覧・解析・加工などが行えます

研究者のこのような悩みを解決

課題 1 膨大な量のファイルからの目的の情報を探すには多大な労力がかかる
解決 1 ファイルを指定するだけで、自動解析し位置を特定することが可能です        
課題 2 テキスト化されていないPDFに対しては、文字列による検索が行えない
解決 2 "Non Text PDF"にも対応しているので、解析業務を一気に効率化します        
課題 3 描画ツールを用いても、化合物を一から作画するのが大変である
解決 3 テキストから構造式を呼び出し、瞬時に構造を描画可能です             
課題 4 様々なファイル形式が存在し、種類によって情報の特定方法が異なる
解決 4 幅広いファイル形式に対応しており、抽出後にデータの一元管理が可能です      

動画

Overview: Document to Structure

Overview: Japanese Name to Structure

資料ダウンロード

価格・動作環境

詳細はお問合せください

Patcore に関するお問い合わせ

富士通は、Patcore製品の販売代理店です。
ページの先頭へ