Pat
J-GLOBAL ID:200903016779856800

サブスタンス辞書の作成方法、サブスタンス間の二項関係抽出方法、予測方法、及び表示方法

Inventor:
Applicant, Patent owner:
Agent (1): 平木 祐輔
Gazette classification:公開公報
Application number (International application number):2001389474
Publication number (International publication number):2003186894
Application date: Dec. 21, 2001
Publication date: Jul. 04, 2003
Summary:
【要約】【課題】 データベースにある論文から遺伝子やタンパク質や低分子等のサブスタンス名とそれらの間の二項関係を自動的に効率よく抽出し、抽出した二項関係をユーザに分かりやすい形で可視化して表示する。【解決手段】 公共データベース(SWISSPROT、PIR、CSNDB)からタンパク質名、シノニム、クロスリファレンス情報を抽出し、それらの関係よりタンパク質名の辞書を作成する。二項関係の抽出は、まず二項関係を表す文のパターンに基づいて行い、それだけでは抽出しきれないものについては、更にテキスト文書の重みベクトル化を用いて二項関係の存在の予測を試みる。関係が抽出できたら、後でユーザが目的とする二項関係を得るための一助とするため、その関係にいくつかの強度を定義して与える。強度RF,GGRが指定した値以上あるいは以下の二項関係を選択的に表示できるようにする。
Claim (excerpt):
複数のデータベースから、サブスタンスの名称とそのシノニムからなる用語グループ、及び同一のサブスタンスの呼称として2以上の異なる名称が用いられていることを示すクロスリファレンス情報を収集するステップと、前記収集した用語グループ同士を比較し、同じ名称を含む用語グループ同士あるいは同じシノニムを含む用語グループ同士を結合するステップと、前記クロスリファレンス情報を用いて、同一のサブスタンスを表す用語グループ同士を結合するステップとを含むことを特徴とするサブスタンス辞書の作成方法。
IPC (4):
G06F 17/30 230 ,  G06F 17/30 170 ,  G06F 17/30 ,  G06F 17/30 360
FI (4):
G06F 17/30 230 Z ,  G06F 17/30 170 A ,  G06F 17/30 170 F ,  G06F 17/30 360 Z
F-Term (5):
5B075ND02 ,  5B075NK35 ,  5B075NR12 ,  5B075PR06 ,  5B075UU01
Patent cited by the Patent:
Cited by examiner (1)

Return to Previous Page