Pat
J-GLOBAL ID:200903052278684739
意味ネットワーク自動作成装置及びコンピュータ可読記録媒体
Inventor:
,
Applicant, Patent owner:
Agent (1):
境 廣巳
Gazette classification:公開公報
Application number (International application number):2000057971
Publication number (International publication number):2001243223
Application date: Feb. 29, 2000
Publication date: Sep. 07, 2001
Summary:
【要約】【課題】 大量のテキストデータに基づき、単語と単語の想起関係を有向グラフで表現した意味ネットワークを自動的に作成する。【解決手段】 統計部2は、複数のテキストを入力して形態素解析を行い、単語と単語の共起頻度、単語の出現頻度、全テキスト数を統計する。次に、計算部3は、統計部2から単語と単語の共起頻度等を入力し、任意の単語から任意の他の単語への想起の強さを情報量尺度を用いて計算する。このとき、単語Aから他の単語Bへの想起の強さは、単語Aが出現するテキスト群における単語Bの出現、非出現にかかる統計量および単語Aが出現しないテキスト群における単語Bの出現、非出現にかかる統計量を考慮して計算する。次に、作成部4は、計算部3から単語と単語の想起の強さを入力し、入力された想起の強さが予め定めた閾値以上の単語から単語へ有向のリンクを付けることによって意味ネットワークを作成し、記憶部1に出力する。
Claim (excerpt):
単語からなる意味ネットワークを記憶する記憶部と、複数のテキストを入力し、入力されたテキストに対して形態素解析を行い、形態素解析を行ったテキストから、単語と単語の共起頻度、単語の出現頻度、全テキスト数を統計する統計部と、前記統計部から単語と単語の共起頻度、単語の出現頻度、全テキスト数を入力し、入力された単語と単語の共起頻度、単語の出現頻度、全テキスト数を基に、各単語に対して、その単語から他の単語への想起の強さを情報量尺度を用いて計算する計算部と、一つの単語を一つのノードとして表現し、表現された各々のノードに対して、そのノードの単語から他のノードの単語への想起の強さを前記計算部から参照し、参照された想起の強さが予め定められた閾値以上の場合、そのノードから他のノードへ有向リンクを張り、有向リンクが張られた有向グラフを単語からなる意味ネットワークとして前記記憶部に出力する作成部とを備えることを特徴とする意味ネットワーク自動作成装置。
IPC (4):
G06F 17/27
, G06F 17/30 230
, G06F 17/30 330
, G10L 15/18
FI (5):
G06F 17/30 230 Z
, G06F 17/30 330 C
, G06F 15/38 D
, G10L 3/00 537 C
, G10L 3/00 537 G
F-Term (17):
5B075NK32
, 5B075NK44
, 5B075NR02
, 5B075NR20
, 5B075QT10
, 5B091AA15
, 5B091CA02
, 5B091CC05
, 5B091CC16
, 5B091EA01
, 5B091EA24
, 5D015HH23
, 9A001CC02
, 9A001HH15
, 9A001HH23
, 9A001JJ12
, 9A001JJ25
Patent cited by the Patent:
Cited by examiner (3)
-
用語辞書生成方法および用語辞書生成プログラムを記録した記録媒体
Gazette classification:公開公報
Application number:特願平9-257364
Applicant:日本電信電話株式会社
-
シソーラス・システム
Gazette classification:公開公報
Application number:特願平3-280614
Applicant:新日本製鐵株式会社
-
テキスト情報を処理する方法および装置
Gazette classification:公開公報
Application number:特願平11-129786
Applicant:インターナショナル・ビジネス・マシーンズ・コーポレイション
Return to Previous Page