特許
J-GLOBAL ID:200903019384162825

名詞シソ-ラスへの未知語登録方法、その装置及び未知語登録プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 鈴木 誠
公報種別:公開公報
出願番号(国際出願番号):特願平11-032475
公開番号(公開出願番号):特開2000-231572
出願日: 1999年02月10日
公開日(公表日): 2000年08月22日
要約:
【要約】【課題】 カルバック・ライブラー情報量を尺度に、統計的に未知語と最も似タ共起の仕方をする名詞シソーラスのノードを未語登録ノードとすることを可能にする。【解決手段】 コーパス120中の文書データにおける未知語と各動詞の共起頻度及びコーパス中の文書データにおける名詞シソーラス130の各ノードと各動詞の共起頻度を算出する手段100、共起頻度情報を用い未知語が各動詞と共起する多項分布のベイズ推定量及び名詞シソーラスの各ノードと各動詞が共起する多項分布のベイズ推定量を算出する手段200、ベイズ推定量を用いカルバック・ライブラー情報量を尺度に未知語と最も近い多項分布を有す名詞シソーラスのノードを未知語登録ノードとして出力する手段300よりなる。
請求項(抜粋):
既存の名詞シソーラスに未知語を登録する方法において、未知語が与えられるとコーパス中の文書データにおける未知語と各動詞の共起頻度及びコーパス中の文書データにおける名詞シソーラスの各ノードと各動詞の共起頻度を算出するステップと、前記共起頻度を用いて未知語が各動詞と共起する多項分布のベイズ推定量及び名詞シソーラスの各ノードと各動詞が共起する多項分布のベイズ推定量を算出するステップと、前記ベイズ推定量を用いてカルバック・ライブラー情報量を尺度に未知語と最も近い多項分布を有す名詞シソーラスのノードを未知語登録ノードとして決定するステップとを有することを特徴とする名詞シソーラスへの未知語登録方法。
FI (2件):
G06F 15/403 320 D ,  G06F 15/401 340 A
Fターム (3件):
5B075ND03 ,  5B075PP12 ,  5B075PP24

前のページに戻る