特許
J-GLOBAL ID:201603017049182466
言語モデル用の学習テキストを選択する方法及び当該学習テキストを使用して言語モデルを学習する方法、並びに、それらを実行するためのコンピュータ及びコンピュータ・プログラム
発明者:
,
,
出願人/特許権者:
代理人 (4件):
上野 剛史
, 太佐 種一
, 松井 光夫
, 村上 博司
公報種別:公開公報
出願番号(国際出願番号):特願2014-150554
公開番号(公開出願番号):特開2016-024759
出願日: 2014年07月24日
公開日(公表日): 2016年02月08日
要約:
【課題】本発明は、対象分野のコーパスに含まれる文に類似する文を対象分野外のコーパスから効率よく集める技法を提供することを目的とする。【解決手段】本発明に従う言語モデル用の学習テキストを選択する技法は、第1のドメインのコーパスから選択された単語列中の1又は複数の単語を、任意の単語又は単語列を表す特殊記号に置換し、当該置換された単語列を、上記学習テキストを選択する為のテンプレートとする生成技法、又は、第1のドメインのコーパスから選択された単語列を、上記学習テキストを選択する為のテンプレートとする生成技法の少なくとも1つの生成技法に従って、第1のドメインのコーパスから学習テキストを選択する為のテンプレートを生成すること、第1のドメインと異なる第2のドメインのコーパスから上記テンプレートで被覆されるテキストを上記学習テキストとして選択することを含む。【選択図】図2A
請求項(抜粋):
言語モデル用の学習テキストを選択する方法であって、コンピュータが、
(1)第1のドメインのコーパスから選択された単語列中の1又は複数の単語を、任意の単語又は単語列を表す特殊記号に置換し、当該特殊記号で置換された単語列を、前記学習テキストを選択する為のテンプレートとする生成技法:又は、
(2)第1のドメインのコーパスから選択された単語列を、前記学習テキストを選択する為のテンプレートとする生成技法
の少なくとも1つの生成技法に従って、前記第1のドメインのコーパスから学習テキストを選択する為のテンプレートを生成するステップと、
前記第1のドメインと異なる第2のドメインのコーパスから前記テンプレートで被覆されるテキストを前記学習テキストとして選択するステップと
を実行することを含む、前記方法。
IPC (3件):
G06F 17/27
, G10L 15/06
, G10L 15/197
FI (3件):
G06F17/27 Z
, G10L15/06 300E
, G10L15/197
Fターム (3件):
5B091AA11
, 5B091CA00
, 5B091EA01
引用文献:
前のページに戻る