特許
J-GLOBAL ID:200903090980544634

辞書作成方法、装置、辞書作成プログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 金田 暢之 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2000-299655
公開番号(公開出願番号):特開2002-108860
出願日: 2000年09月29日
公開日(公表日): 2002年04月12日
要約:
【要約】【課題】 取り扱う適用分野に応じて各意味カテゴリにはどのような語が代表語彙であるかを示す意味カテゴリ辞書を作成する。【解決手段】 コーパス解析部11はコーパス記憶部10から2種類以上のコーパスを読み出し、各コーパスから該コーパス中に出現する主名詞を同定しうる情報を得る。主名詞抽出部12は解析結果を基にどのコーパスにも出現する主名詞(共通主名詞)を抽出し、コーパス毎に各共通主名詞の出現頻度を算出する。スコア情報付与部13は、抽出された各共通主名詞の持つ語義の意味カテゴリの順位により決まる重み値と各コーパス中における該共通主名詞の出現頻度に応じて該共通主名詞に得点を付与する。登録名詞選択部16は共通主名詞を意味カテゴリ毎に付与された点数の高い順に並べ変え、上位より一定数を選択し、意味カテゴリレコード記憶部17に格納する。
請求項(抜粋):
辞書レコードの属性として、エントリ意味カテゴリの表記と、該エントリ意味カテゴリを語義に持つ単語リストを有し、自然言語処理システムにおける意味制約をシステム構築者が付与する際に参照する意味カテゴリ辞書を自動的に作成する辞書作成方法であって、2種類以上のコーパスから該コーパス中に出現する、名詞句の中心をなす、固有名詞以外の名詞である主名詞を同定し得る情報を、該コーパスを解析することにより獲得するステップと、各コーパスの解析結果を基に、どのコーパスにも出現する主名詞である共通主名詞を抽出すると共に、コーパス毎に各共通主名詞の出現頻度を算出するステップと、抽出された各共通主名詞の持つ各語義の意味カテゴリの順位により決まる重み値と、各コーパス中における当該共通主名詞の出現頻度に応じて各語義に対する当該共通主名詞の得点を当該共通主名詞に付与するステップと、前記共通主名詞を意味カテゴリ毎に、付与された点数の高い順に並べ変え、上位より一定数を選択し、該選択された共通主名詞群を格納するステップを有する辞書作成方法。
IPC (2件):
G06F 17/28 ,  G06F 17/27
FI (2件):
G06F 17/28 C ,  G06F 17/27 M
Fターム (5件):
5B091CA02 ,  5B091CC02 ,  5B091CC04 ,  5B091CC05 ,  5B091CC16

前のページに戻る