特許
J-GLOBAL ID:200903086758108535

モデル学習方法、情報抽出方法、モデル学習装置、情報抽出装置、モデル学習プログラム、情報抽出プログラム、およびそれらプログラムを記録した記録媒体

発明者:
出願人/特許権者:
代理人 (2件): 磯野 道造 ,  大石 恵
公報種別:公開公報
出願番号(国際出願番号):特願2006-155970
公開番号(公開出願番号):特開2007-322984
出願日: 2006年06月05日
公開日(公表日): 2007年12月13日
要約:
【課題】認識誤りによる影響を軽減するモデル学習方法および情報抽出方法を提供する。【解決手段】識別モデルにおいて、端末装置が、モデル学習時に、抽出対象情報が付与された、誤りを含む認識単語列学習データと、同様に抽出対象情報が付与された、誤りを含まない参照単語列学習データとを用いてモデル情報を作成する。その際、認識確信度素性を2値化することで、認識単語列と参照単語列との両方を用いてモデル情報を作成する。情報抽出時には、入力データから認識された各認識単語が正しいか否かを示す認識確信度素性を認識単語列に付与する。この認識確信度素性がある閾値以上であれば、単語の認識は「正」、そうでなければ単語の認識は「誤」とする。そして、作成されたモデル情報を用いて抽出対象情報を認識単語列に付与し、付与された抽出対象情報に基づいて単語を抽出する。【選択図】図5
請求項(抜粋):
入力データから情報を抽出する際に用いられる、抽出対象情報の確信度を算出するためのモデル情報を学習するモデル学習方法であって、 前記モデル情報を学習するモデル学習装置が、 学習用入力データを認識し、認識した単語から認識単語列を作成する単語列認識ステップと、 前記学習用入力データに対応する参照単語列に示される、認識誤りを含まない正解単語列、および前記認識単語列を比較することで、前記認識単語列の正誤情報を作成して、前記作成した正誤情報を、前記認識単語列に付与する単語列対応付けステップと、 前記正誤情報が付与された認識単語列、および前記参照単語列を比較し、前記参照単語列の各単語に設定されている抽出対象情報を、前記比較結果に応じて前記認識単語列に付与することで、前記正誤情報および前記抽出対象情報を備えた認識単語列学習データを作成する認識単語列学習データ作成ステップと、 前記参照単語列に、前記正誤情報のうち正の情報を付与することで、前記正の情報および前記抽出対象情報を備えた参照単語列学習データを作成する参照単語列学習データ作成ステップと、 前記認識単語列学習データおよび前記参照単語列学習データを用いて前記モデル情報を作成し、記憶手段に格納するモデル作成ステップと を含むことを特徴とするモデル学習方法。
IPC (3件):
G10L 15/06 ,  G06N 5/04 ,  G10L 15/14
FI (4件):
G10L15/06 300H ,  G06N5/04 580A ,  G10L15/14 153 ,  G10L15/06 300Y
Fターム (2件):
5D015GG01 ,  5D015HH00
引用特許:
出願人引用 (4件)
全件表示
審査官引用 (3件)
引用文献:
前のページに戻る