特許
J-GLOBAL ID:200903025568241485
形態素解析装置、方法及びプログラム
発明者:
出願人/特許権者:
代理人 (1件):
工藤 宣幸
公報種別:公開公報
出願番号(国際出願番号):特願2004-206996
公開番号(公開出願番号):特開2006-031228
出願日: 2004年07月14日
公開日(公表日): 2006年02月02日
要約:
【課題】 未知語を含む文章の形態素解析結果を、計算量などを増大させることなく、より高精度にする。【解決手段】 本発明では、解析対象文に対する形態素解析結果の候補である仮説として、辞書に登録されている既知語の仮説と、未知語を構成する文字単位の仮説とが混在したものを生成し、各仮説の生成確率を、形態素やn-gramや未知語を構成する文字の、予め用意されている確率的なモデルの情報を用いて計算する。そして、解となる仮説を探索する。探索された解の中に未知語を構成する文字がある場合には、それらの文字を結合して未知語を復元する。【選択図】 図1
請求項(抜粋):
形態素解析対象文に対して、形態素解析結果の候補である仮説を1又は複数生成するものであって、生成する仮説の中に、辞書に登録されている既知語の仮説と、未知語を構成する文字単位の仮説とが混在したものがある仮説生成手段と、
形態素やn-gramや未知語を構成する文字の確率的なモデルの情報を格納しているモデル格納手段と、
上記各仮説に対し、その仮説の生成確率を、上記モデル格納手段に格納されている確率的なモデルの情報を用いて求める生成確率計算手段と、
上記各仮説の生成確率に基づき、解となる仮説を探索する解探索手段と、
探索された解の中に未知語を構成する文字がある場合に、それらの文字を結合して未知語を復元する未知語復元手段と
を備えたことを特徴とする形態素解析装置。
IPC (2件):
FI (2件):
G06F17/27 E
, G10L3/00 537D
Fターム (8件):
5B091AA15
, 5B091CA02
, 5B091CC01
, 5B091EA01
, 5B091EA24
, 5D015AA04
, 5D015BB01
, 5D015CC17
引用特許:
前のページに戻る