特許
J-GLOBAL ID:200903016779856800

サブスタンス辞書の作成方法、サブスタンス間の二項関係抽出方法、予測方法、及び表示方法

発明者:
出願人/特許権者:
代理人 (1件): 平木 祐輔
公報種別:公開公報
出願番号(国際出願番号):特願2001-389474
公開番号(公開出願番号):特開2003-186894
出願日: 2001年12月21日
公開日(公表日): 2003年07月04日
要約:
【要約】【課題】 データベースにある論文から遺伝子やタンパク質や低分子等のサブスタンス名とそれらの間の二項関係を自動的に効率よく抽出し、抽出した二項関係をユーザに分かりやすい形で可視化して表示する。【解決手段】 公共データベース(SWISSPROT、PIR、CSNDB)からタンパク質名、シノニム、クロスリファレンス情報を抽出し、それらの関係よりタンパク質名の辞書を作成する。二項関係の抽出は、まず二項関係を表す文のパターンに基づいて行い、それだけでは抽出しきれないものについては、更にテキスト文書の重みベクトル化を用いて二項関係の存在の予測を試みる。関係が抽出できたら、後でユーザが目的とする二項関係を得るための一助とするため、その関係にいくつかの強度を定義して与える。強度RF,GGRが指定した値以上あるいは以下の二項関係を選択的に表示できるようにする。
請求項(抜粋):
複数のデータベースから、サブスタンスの名称とそのシノニムからなる用語グループ、及び同一のサブスタンスの呼称として2以上の異なる名称が用いられていることを示すクロスリファレンス情報を収集するステップと、前記収集した用語グループ同士を比較し、同じ名称を含む用語グループ同士あるいは同じシノニムを含む用語グループ同士を結合するステップと、前記クロスリファレンス情報を用いて、同一のサブスタンスを表す用語グループ同士を結合するステップとを含むことを特徴とするサブスタンス辞書の作成方法。
IPC (4件):
G06F 17/30 230 ,  G06F 17/30 170 ,  G06F 17/30 ,  G06F 17/30 360
FI (4件):
G06F 17/30 230 Z ,  G06F 17/30 170 A ,  G06F 17/30 170 F ,  G06F 17/30 360 Z
Fターム (5件):
5B075ND02 ,  5B075NK35 ,  5B075NR12 ,  5B075PR06 ,  5B075UU01
引用特許:
審査官引用 (1件)

前のページに戻る