言語解析モデル学習装置、言語解析モデル学習方法、言語解析モデル学習プログラムならびにその記録媒体

発明者：
出願人/特許権者：
代理人 (2件)：磯野道造 , 大石恵
公報種別：公開公報
出願番号（国際出願番号）：特願2007-063941
公開番号（公開出願番号）：特開2008-225907
出願日： 2007年03月13日
公開日（公表日）： 2008年09月25日
要約：

【課題】低コストで言語解析モデルの予測性能を向上できる系列構造予測器の学習を行う言語解析モデル学習技術を提供する。【解決手段】言語解析モデル学習装置2は、ラベルなしデータDuを利用して学習済み識別モデル用パラメタベクトル集合Λとモデル統合用パラメタ集合Γとを学習することで第1目的関数を最大化する生成モデル用パラメタベクトル集合Θを決定する生成モデル学習手段21と、ラベルありデータDlを利用して識別モデル用パラメタベクトル集合Λと生成モデル用パラメタベクトル集合Θとを学習することで第2目的関数を最大化するモデル統合用パラメタ集合Γを決定するモデル統合学習手段22と、生成モデル用パラメタベクトル集合Θとモデル統合用パラメタ集合Γとを交互に決定させて一方が収束条件を満たすときに生成モデル用パラメタベクトル集合Θとモデル統合用パラメタ集合Γとを出力する収束判定手段23とを備える。【選択図】図2

請求項（抜粋）：

文字列または記号列にラベルが付与されたデータを示すラベルありデータと、文字列または記号列を示すラベルなしデータとを入力データとして、識別モデルと生成モデルとに基づいて、文字列または記号列に付与すべきラベルを推定するために使用される言語解析モデルを学習する言語解析モデル学習装置であって、前記識別モデルは、入力される文字列または記号列を条件に予め定められたラベル候補が出現する確率を示す条件付き確率を用いて前記付与すべきラベルを推定するモデルであり、前記生成モデルは、入力される文字列または記号列と前記予め定められたラベル候補とが同時に生成される確率を示す同時確率を用いて前記付与すべきラベルを推定するモデルであり、前記入力されたラベルなしデータを利用して、予め学習された識別モデル用パラメタベクトル集合と、予め定められたモデル統合用パラメタ集合とを学習することで第1目的関数を最大化するような生成モデル用パラメタベクトル集合を決定する生成モデル学習手段と、前記入力されたラベルありデータを利用して、前記識別モデル用パラメタベクトル集合と、前記生成モデル用パラメタベクトル集合とを学習することで第2目的関数を最大化するような前記モデル統合用パラメタ集合を決定するモデル統合学習手段と、前記生成モデル用パラメタベクトル集合と前記モデル統合用パラメタ集合とを交互に決定させて、いずれか一方が所定の収束条件を満たすときに、その時点の前記生成モデル用パラメタベクトル集合と前記モデル統合用パラメタ集合とを出力する収束判定手段とを備えることを特徴とする言語解析モデル学習装置。

IPC (2件)：

G06F 17/28 , G06N 3/00

FI (2件)：

G06F17/28 U , G06N3/00 560J

Fターム (4件)：

5B091AA15 , 5B091AB06 , 5B091CA02 , 5B091EA01

引用特許：

審査官引用 (2件)

教師データ作成装置およびプログラム、言語解析処理装置およびプログラム、ならびに要約処理装置およびプログラム
公報種別：公開公報出願番号：特願2004-103862 出願人：独立行政法人情報通信研究機構
AVシステム
公報種別：公開公報出願番号：特願2003-272441 出願人：シャープ株式会社

引用文献：

審査官引用 (3件)

前のページに戻る