特許
J-GLOBAL ID:200903016016855188
言語処理装置およびプログラム
発明者:
出願人/特許権者:
代理人 (2件):
志賀 正武
, 高橋 詔男
公報種別:公開公報
出願番号(国際出願番号):特願2008-148047
公開番号(公開出願番号):特開2009-294913
出願日: 2008年06月05日
公開日(公表日): 2009年12月17日
要約:
【課題】日本語の漢字仮名混じり文などのテキストに対して、誤りが少なくなるような単語分割および読み仮名付与を行なえる言語処理装置を提供する。【解決手段】本発明による言語処理装置は、テキストデータを読み込み、読み込んだ前記テキストデータを基に単語分割の正解候補を展開し、各々の前記正解候補に対して単語分割の正解単語数の期待値のスコアを算出し、算出した前記スコアが最良の前記正解候補を選択し、選択された前記正解候補の単語分割を出力する単語分割処理部を具備する構成とする。単語分割処理部は、単語分割の正解候補の、単語列と品詞列と読み仮名と係り受け構造の少なくともいずれかに基づく値を返す関数であるルールと、前記ルールに関する重み値を記憶する単語分割モデルを利用してスコアを算出する。【選択図】図1
請求項(抜粋):
単語分割の正解候補の、単語列と品詞列と読み仮名と係り受け構造の少なくともいずれかに基づく値を返す関数と、前記関数ごとの重み値を記憶する単語分割モデル記憶部と、
テキストデータを読み込み、読み込んだ前記テキストデータを基に単語分割の正解候補を展開し、前記正解候補ごとに、前記単語分割モデル記憶部から読み出した前記関数を適用して前記値を算出するとともに前記関数ごとの前記重み値による重み付けを用いて単語分割の正解単語数の期待値のスコアを算出し、算出した前記スコアが最良の前記正解候補を選択し、選択された前記正解候補の単語分割を出力する単語分割処理部と、
を具備することを特徴とする言語処理装置。
IPC (3件):
G06F 17/27
, G06F 17/21
, G06F 17/22
FI (3件):
G06F17/27 E
, G06F17/21 550A
, G06F17/22 512V
Fターム (4件):
5B091CA02
, 5B109MJ04
, 5B109QA02
, 5B109QA03
引用特許:
引用文献:
出願人引用 (1件)
-
単語ラティスの識別的スコアリングにおける素性の検討
審査官引用 (1件)
-
単語ラティスの識別的スコアリングにおける素性の検討
前のページに戻る