特許
J-GLOBAL ID:200903052278684739

意味ネットワーク自動作成装置及びコンピュータ可読記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 境 廣巳
公報種別:公開公報
出願番号(国際出願番号):特願2000-057971
公開番号(公開出願番号):特開2001-243223
出願日: 2000年02月29日
公開日(公表日): 2001年09月07日
要約:
【要約】【課題】 大量のテキストデータに基づき、単語と単語の想起関係を有向グラフで表現した意味ネットワークを自動的に作成する。【解決手段】 統計部2は、複数のテキストを入力して形態素解析を行い、単語と単語の共起頻度、単語の出現頻度、全テキスト数を統計する。次に、計算部3は、統計部2から単語と単語の共起頻度等を入力し、任意の単語から任意の他の単語への想起の強さを情報量尺度を用いて計算する。このとき、単語Aから他の単語Bへの想起の強さは、単語Aが出現するテキスト群における単語Bの出現、非出現にかかる統計量および単語Aが出現しないテキスト群における単語Bの出現、非出現にかかる統計量を考慮して計算する。次に、作成部4は、計算部3から単語と単語の想起の強さを入力し、入力された想起の強さが予め定めた閾値以上の単語から単語へ有向のリンクを付けることによって意味ネットワークを作成し、記憶部1に出力する。
請求項(抜粋):
単語からなる意味ネットワークを記憶する記憶部と、複数のテキストを入力し、入力されたテキストに対して形態素解析を行い、形態素解析を行ったテキストから、単語と単語の共起頻度、単語の出現頻度、全テキスト数を統計する統計部と、前記統計部から単語と単語の共起頻度、単語の出現頻度、全テキスト数を入力し、入力された単語と単語の共起頻度、単語の出現頻度、全テキスト数を基に、各単語に対して、その単語から他の単語への想起の強さを情報量尺度を用いて計算する計算部と、一つの単語を一つのノードとして表現し、表現された各々のノードに対して、そのノードの単語から他のノードの単語への想起の強さを前記計算部から参照し、参照された想起の強さが予め定められた閾値以上の場合、そのノードから他のノードへ有向リンクを張り、有向リンクが張られた有向グラフを単語からなる意味ネットワークとして前記記憶部に出力する作成部とを備えることを特徴とする意味ネットワーク自動作成装置。
IPC (4件):
G06F 17/27 ,  G06F 17/30 230 ,  G06F 17/30 330 ,  G10L 15/18
FI (5件):
G06F 17/30 230 Z ,  G06F 17/30 330 C ,  G06F 15/38 D ,  G10L 3/00 537 C ,  G10L 3/00 537 G
Fターム (17件):
5B075NK32 ,  5B075NK44 ,  5B075NR02 ,  5B075NR20 ,  5B075QT10 ,  5B091AA15 ,  5B091CA02 ,  5B091CC05 ,  5B091CC16 ,  5B091EA01 ,  5B091EA24 ,  5D015HH23 ,  9A001CC02 ,  9A001HH15 ,  9A001HH23 ,  9A001JJ12 ,  9A001JJ25
引用特許:
出願人引用 (3件) 審査官引用 (3件)

前のページに戻る