特許
J-GLOBAL ID:200903010233385582

自然言語処理装置

発明者:
出願人/特許権者:
代理人 (1件): 高橋 光男
公報種別:公開公報
出願番号(国際出願番号):特願平5-291403
公開番号(公開出願番号):特開平7-121545
出願日: 1993年10月27日
公開日(公表日): 1995年05月12日
要約:
【要約】【目的】 形態素解析における接続規則による候補語群の絞り込みをより正確に、かつ厳密に行なう。【構成】 文章解析部3の辞書検索部4により、漢字かな混じり文の検索対象文字列に応じて、辞書2の自立語辞書2a,接頭語辞書2b,および非自立辞書である付属語辞書2c,接尾語辞書2d,助数詞辞書2e,補助用言辞書2fを検索し、特に、上記非自立語辞書の付加情報に従って上記検索対象文字列の候補語群を抽出する。そして、該候補語群に基づいて、形態素解析部5により、形態素同士の接続規則を用いて、漢字かな混じり文を形態素に分解する。このため、的確な付属語列の切り分けが可能となり、例えば、音声合成システムにおいては、正確なアクセント付与が可能となる。また、同形異続の接尾語の読み分けも同一の機構で行なえる。
請求項(抜粋):
漢字かな混じり文の形態素解析を行なう自然言語処理装置において、形態素の基準となる単語の綴りと、該単語の品詞と、該単語が後続可能な単語や後接可能な単語のカテゴリー情報と、該単語が後接した際に接続したもの全体がとる品詞情報とを付加情報として、各単語毎に有する非自立語辞書と、自立語の綴りと、その品詞情報とを有する自立語辞書と、前記漢字かな混じり文の検索対象文字列に応じて、前記非自立語辞書と前記自立語辞書とを検索し、前記付加情報に従って前記検索対象文字列の候補語群を抽出し、該候補語群に基づいて、形態素同士の接続規則を用いて前記漢字かな混じり文を形態素に分解する文章解析手段とを具備することを特徴とする自然言語処理装置。
IPC (4件):
G06F 17/28 ,  G06F 17/22 ,  G10L 3/00 ,  G10L 5/04
FI (2件):
G06F 15/38 C ,  G06F 15/20 520 Z

前のページに戻る