特許
J-GLOBAL ID:200903074563107455

単語分割装置およびプログラム

発明者:
出願人/特許権者:
代理人 (1件): 有我 軍一郎
公報種別:公開公報
出願番号(国際出願番号):特願2001-318780
公開番号(公開出願番号):特開2003-122749
出願日: 2001年10月17日
公開日(公表日): 2003年04月25日
要約:
【要約】【課題】 非現実的な単語分割の計算を省いて効率性および利便性を改善する単語分割装置およびプログラムを提供する。【解決手段】 単語分割装置50に、単語のみを登録している辞書、および単語間の接続確率を付与する言語モデル(Nグラムモデル)を記憶しておき、入力された日本語テキストについて、仮説生成・削除部30により、前記辞書に登録された単語からなる単語分割の仮説を複数生成し、仮説計算部20により、前記言語モデルに基づいて当該仮説における単語間の接続確率の積を計算して、単語間の接続確率の積が最大となる仮説のみを残すようにマージし、文末での単語間の接続確率の積が最大となる仮説を選択する。
請求項(抜粋):
日本語テキストを入力する入力手段と、単語を登録している辞書、および単語間の接続確率を与える言語モデルを記憶するための記憶手段と、前記入力手段によって入力された日本語テキストについて、前記辞書に登録された単語による単語分割の仮説を複数生成し、前記言語モデルに基づいて当該仮説における単語間の接続確率の積を計算し、単語間の接続確率の積が最大となる仮説のみを残すようにマージし、文末での単語間の接続確率の積が最大となる仮説を選択する仮説選択手段とを設けたことを特徴とする単語分割装置。
IPC (3件):
G06F 17/27 ,  G06F 17/22 514 ,  G10L 15/18
FI (4件):
G06F 17/27 E ,  G06F 17/22 514 M ,  G10L 3/00 537 D ,  G10L 3/00 537 A
Fターム (13件):
5B009MB07 ,  5B009MB16 ,  5B009MF03 ,  5B009QA03 ,  5B091AA15 ,  5B091AB20 ,  5B091CA02 ,  5B091CB01 ,  5B091CB21 ,  5B091CC02 ,  5B091CC16 ,  5B091CD01 ,  5D015HH23

前のページに戻る