特許
J-GLOBAL ID:200903021257937324

形態素解析装置、形態素解析方法及び形態素解析プログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  草野 卓 ,  中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2006-145395
公開番号(公開出願番号):特開2007-316916
出願日: 2006年05月25日
公開日(公表日): 2007年12月06日
要約:
【課題】長音による変形表現が含まれた入力テキストに対し、高い精度で形態解析を行う。【解決手段】入力テキストを解析して単語連鎖候補列を生成し、その少なくとも一部である文頭から文末までの選択単語連鎖列から、長音による変形表現と推定される平仮名・長音単語列を抽出する。次に、平仮名・長音単語列の信頼度を評価し、信頼度が低いと評価された平仮名・長音単語列を、長音を有しない無長音単語列に変換する。そして、無長音単語列を解析して無長音単語連鎖候補列を生成する。次に、無長音単語連鎖候補列の少なくとも一部の単語を、長音を含む単語に置換し、各単語の表記を接続した文字列が平仮名・長音単語列のものと同じとなる長音単語連鎖候補列を生成し、長音単語連鎖候補列を単語連鎖候補列にマージし、単語連鎖候補列を更新する。【選択図】図3
請求項(抜粋):
入力テキストの単語情報列を生成する形態素解析装置において、 上記入力テキストを構成し得る接続可能な単語の列と、各単語の接続関係と、品詞と、コストとを関連つけた情報である単語連鎖候補列を生成する単語連鎖候補列生成部と、 上記単語連鎖候補列の少なくとも一部である文頭から文末までの選択単語連鎖列から、長音による変形表現と推定される平仮名・長音単語列を抽出する平仮名・長音単語列抽出部と、 上記平仮名・長音単語列の信頼度を評価する信頼度評価部と、 上記信頼度が低いと評価された上記平仮名・長音単語列を、長音を有しない無長音単語列に変換する無長音単語列変換部と、 上記無長音単語列を構成し得る接続可能な単語の列と、各単語の接続関係と、品詞と、コストとを関連つけた情報である無長音単語連鎖候補列を生成する無長音単語連鎖候補列生成部と、 上記無長音単語連鎖候補列の少なくとも一部の単語を、長音を含む単語に置換し、各単語の表記を接続した文字列が上記平仮名・長音単語列のものと同じとなる長音単語連鎖候補列を生成する長音単語連鎖候補列生成部と、 上記長音単語連鎖候補列を上記単語連鎖候補列にマージし、上記単語連鎖候補列を更新するマージ部と、 を有することを特徴とする形態素解析装置。
IPC (1件):
G06F 17/27
FI (1件):
G06F17/27 E
Fターム (3件):
5B091AA15 ,  5B091AB01 ,  5B091CA02

前のページに戻る