Pat
J-GLOBAL ID:200903021257937324
形態素解析装置、形態素解析方法及び形態素解析プログラム
Inventor:
Applicant, Patent owner:
Agent (3):
中尾 直樹
, 草野 卓
, 中村 幸雄
Gazette classification:公開公報
Application number (International application number):2006145395
Publication number (International publication number):2007316916
Application date: May. 25, 2006
Publication date: Dec. 06, 2007
Summary:
【課題】長音による変形表現が含まれた入力テキストに対し、高い精度で形態解析を行う。【解決手段】入力テキストを解析して単語連鎖候補列を生成し、その少なくとも一部である文頭から文末までの選択単語連鎖列から、長音による変形表現と推定される平仮名・長音単語列を抽出する。次に、平仮名・長音単語列の信頼度を評価し、信頼度が低いと評価された平仮名・長音単語列を、長音を有しない無長音単語列に変換する。そして、無長音単語列を解析して無長音単語連鎖候補列を生成する。次に、無長音単語連鎖候補列の少なくとも一部の単語を、長音を含む単語に置換し、各単語の表記を接続した文字列が平仮名・長音単語列のものと同じとなる長音単語連鎖候補列を生成し、長音単語連鎖候補列を単語連鎖候補列にマージし、単語連鎖候補列を更新する。【選択図】図3
Claim (excerpt):
入力テキストの単語情報列を生成する形態素解析装置において、
上記入力テキストを構成し得る接続可能な単語の列と、各単語の接続関係と、品詞と、コストとを関連つけた情報である単語連鎖候補列を生成する単語連鎖候補列生成部と、
上記単語連鎖候補列の少なくとも一部である文頭から文末までの選択単語連鎖列から、長音による変形表現と推定される平仮名・長音単語列を抽出する平仮名・長音単語列抽出部と、
上記平仮名・長音単語列の信頼度を評価する信頼度評価部と、
上記信頼度が低いと評価された上記平仮名・長音単語列を、長音を有しない無長音単語列に変換する無長音単語列変換部と、
上記無長音単語列を構成し得る接続可能な単語の列と、各単語の接続関係と、品詞と、コストとを関連つけた情報である無長音単語連鎖候補列を生成する無長音単語連鎖候補列生成部と、
上記無長音単語連鎖候補列の少なくとも一部の単語を、長音を含む単語に置換し、各単語の表記を接続した文字列が上記平仮名・長音単語列のものと同じとなる長音単語連鎖候補列を生成する長音単語連鎖候補列生成部と、
上記長音単語連鎖候補列を上記単語連鎖候補列にマージし、上記単語連鎖候補列を更新するマージ部と、
を有することを特徴とする形態素解析装置。
IPC (1):
FI (1):
F-Term (3):
5B091AA15
, 5B091AB01
, 5B091CA02
Return to Previous Page