特許
J-GLOBAL ID:200903024355709045
形態素解析方法及び装置及び形態素解析プログラムを格納した記憶媒体
発明者:
出願人/特許権者:
代理人 (1件):
伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願平11-221412
公開番号(公開出願番号):特開2001-051996
出願日: 1999年08月04日
公開日(公表日): 2001年02月23日
要約:
【要約】【課題】 従来の統計的言語モデルを用いた日本語形態素解析における未知語の過分割の問題を解決し、さらに、未知語の品詞を推定することが可能な形態素解析方法及び装置及び形態素解析プログラムを格納した記憶媒体を提供する。【解決手段】 本発明は、入力テキストの部分文字列と照合する単語を単語辞書から検索して単語候補として生成し、単語辞書と照合しない入力テキストの部分文字列から未知語である可能性があるものを未知語候補として選択し、未知語モデルを用いて未知語候補の品詞別単語出現確率を推定し、動的計画法を用いて同時確率が最大となる単語列を求める。
請求項(抜粋):
日本語の形態素解析を行う形態素解析方法において、入力テキストの部分文字列と照合する単語を単語辞書から検索して単語候補として生成し、前記単語辞書と照合しない入力テキストの部分文字列から未知語である可能性があるものを未知語候補として選択し、未知語モデルを用いて未知語候補の品詞別単語出現確率を推定し、動的計画法を用いて同時確率が最大となる単語列を求めることを特徴とする形態素解析方法。
Fターム (4件):
5B091AA15
, 5B091CA02
, 5B091CC02
, 5B091EA24
引用特許:
前のページに戻る