特許
J-GLOBAL ID:200903086903189263

語義曖昧性解消装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 加藤 朝道
公報種別:公開公報
出願番号(国際出願番号):特願平8-352633
公開番号(公開出願番号):特開平10-171806
出願日: 1996年12月13日
公開日(公表日): 1998年06月26日
要約:
【要約】【課題】本発明は、確率的アプローチによる語義曖昧性解消に関するものである。【解決手段】注目単語の周りの文脈に現れる証拠を特定し、特定できた証拠に関する統計情報を基に、注目単語の語義ごとに周りの文脈における証拠からなる確率依存森を学習し、注目単語の語義ごとの確率依存森を基に、各語義の周りの文脈の条件下での条件付き確率を計算し、確率の最も高い語義を出力する。
請求項(抜粋):
注目単語の語義が記されたテキストを記憶するテキスト記憶部と、統計情報を記憶する統計情報記憶部と、前記テキスト記憶部から注目単語の語義が記されたテキストを入力し、入力されたテキストにおける、(a)注目単語の各語義の出現確率、(b)注目単語の語義ごとの周りの文脈に現れる証拠の出現確率、(c)注目単語の語義ごとの周りの文脈に現れる二つの証拠の間の共起確率、及び、(d)注目単語の語義ごとの周りの文脈に現れる二つの証拠の間の相互情報量、の4種類の統計情報を計算し、計算された前記4種類の統計情報を前記統計情報記憶部に記憶する統計処理部と、注目単語の語義が曖昧なテキストを入力する入力部と、注目単語の語義を出力する出力部と、前記入力部から、注目単語の語義が曖昧なテキストを入力し、入力されたテキストにおける、注目単語の周りの文脈に現れる証拠を特定し、特定できた注目単語の語義ごとの周りの文脈に現れる証拠に関する前記4種類の統計情報を前記統計情報記憶部から読み込み、読み込んだ前記4種類の統計情報を基に、注目単語の語義ごとの周りの文脈に現れる証拠からなる確率依存森を学習し、学習できた注目単語の語義ごとの周りの分脈に現れる証拠からなる確率依存森を基に、注目単語の各語義の周りの文脈の条件の下での条件付き確率を計算し、計算できた条件つき確率のもっとも高い注目単語の語義を前記出力部に出力する語義曖昧性解消部と、を備えることを特徴とする語義曖昧性解消装置。
IPC (2件):
G06F 17/27 ,  G10L 3/00 531
FI (2件):
G06F 15/38 M ,  G10L 3/00 531 D

前のページに戻る