特許
J-GLOBAL ID:200903034342203890

形態素解析装置、形態素解析方法、及び形態素解析プログラムを記録したコンピュータ読取り可能な記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 須山 佐一
公報種別:公開公報
出願番号(国際出願番号):特願平11-217985
公開番号(公開出願番号):特開2001-043222
出願日: 1999年07月30日
公開日(公表日): 2001年02月16日
要約:
【要約】【課題】 すべての単語系列に対して評価を行うことなく、効率よく日本語として正しい組合わせとなる単語系列を抽出することのできる形態素解析装置、形態素解析方法、及び形態素解析プログラムを記録したコンピュータ読取り可能な記憶媒体を提供すること、【解決手段】 ある単語を先頭とする得点部分系列に始まる半系列で評価得点が上位N位までのもの、ある単語に始まる半系列で評価得点が上位N位までのものを、後方の単語からの順に、それらの単語について再帰的にそれぞれ抽出して、再帰的に抽出した結果として得られる文頭単語に始まる系列で評価得点が上位N位までのものを出力する。
請求項(抜粋):
単語とこれらの単語の接続関係の情報とを含む単語ネットワークを入手する手段と、前記入手された単語ネットワークの中の特定の単語のつながりを得点部分系列として抽出し、これに所定の得点を与える手段と、前記得点を与えられた得点部分系列を先頭として前記単語ネットワークの最後尾につながる一つの単語列を第1の半系列として、個々の第1の半系列に含まれるすべての得点部分系列の得点の和をその第1の半系列の評価得点として求め、この評価得点が上位N位までの第1の半系列を記憶する第1の記憶手段と、前記単語を先頭として前記単語ネットワークの最後尾につながる一つの単語列を第2の半系列として、個々の第2の半系列に含まれるすべての得点部分系列の得点の和をその第2の半系列の評価得点として求め、この評価得点が上位N位までの第2の半系列を記憶する第2の記憶手段と、前記単語ネットワークのある単語を先頭とする得点部分系列に始まる第1の半系列で評価得点が上位N位までのものを、その得点部分系列の最後の単語に始まる第2の半系列で前記第2の記憶手段に記憶されたものおよびその得点部分系列に接続可能な得点部分系列に始まる第1の半系列で前記第1の記憶手段に記憶されたものの集合の中から抽出する第1の抽出手段と、前記単語ネットワークのある単語に始まる第2の半系列で評価得点が上位N位までのものを、その単語に接続する単語に始まる第2の半系列で前記第2の記憶手段に記憶されたものおよびその単語を先頭とする得点部分系列に始まる第1の半系列で前記第1の記憶手段に記憶されたものの集合の中から抽出する第2の抽出手段と、前記第1の抽出手段および第2の抽出手段による抽出処理を前記単語ネットワークの各単語について後方から前方に向けて再帰的に行うよう制御する手段と、前記第1の抽出手段および第2の抽出手段により抽出された結果をもとに文頭単語に始まり前記単語ネットワークの最後尾につながる系列で評価得点が上位N位までのものを出力する手段とを有することを特徴とする形態素解析装置。
Fターム (3件):
5B091AA15 ,  5B091CA02 ,  5B091EA24

前のページに戻る