特許
J-GLOBAL ID:201303094568624672
学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム
発明者:
,
,
,
出願人/特許権者:
,
代理人 (3件):
中尾 直樹
, 中村 幸雄
, 義村 宗洋
公報種別:公開公報
出願番号(国際出願番号):特願2012-023886
公開番号(公開出願番号):特開2013-161330
出願日: 2012年02月07日
公開日(公表日): 2013年08月19日
要約:
【課題】統計的モデル学習に基づきスコアリングモデルを学習する際に用いる学習データを生成する学習データ生成装置を提供する。【解決手段】学習データ生成装置は複数のドキュメントを与えられ、ドキュメント検索におけるスコアリングモデルを統計的モデル学習に基づき学習する際に用いる学習データを生成する。単語列生成手段は与えられる各ドキュメントに対して、そのドキュメントに含まれる単語を含む単語列を1つ以上生成する。学習データ生成手段は生成した各単語列及びその単語列を生成する際に用いられたドキュメントを指し示すラベルを、それぞれクエリ及びリファレンスとし、クエリ及びリファレンスの組を学習データとする。【選択図】図3
請求項(抜粋):
複数のドキュメントを与えられ、ドキュメント検索におけるスコアリングモデルを統計的モデル学習に基づき学習する際に用いる学習データを生成する学習データ生成装置であって、
与えられる各前記ドキュメントに対して、そのドキュメントに含まれる単語を含む単語列を1つ以上生成する単語列生成手段と、
生成した各前記単語列及びその単語列を生成する際に用いられたドキュメントを指し示すラベルを、それぞれクエリ及びリファレンスとし、クエリ及びリファレンスの組を前記学習データとする学習データ生成手段と、を含む
学習データ生成装置。
IPC (3件):
G06F 17/30
, G10L 15/00
, G10L 15/10
FI (4件):
G06F17/30 210A
, G10L15/00 200T
, G10L15/10 200W
, G06F17/30 170A
Fターム (2件):
引用特許:
引用文献:
前のページに戻る