特許
J-GLOBAL ID:202203012264871847

ランダム・ドキュメント埋め込みを用いたテキスト・データ表現学習

発明者:
出願人/特許権者:
代理人 (2件): 上野 剛史 ,  太佐 種一
公報種別:特許公報
出願番号(国際出願番号):IB2018056441
特許番号:特許第7002638号
出願日: 2018年08月24日
請求項(抜粋):
【請求項1】 テキスト・データに対する教師なし特徴表現学習を行うための方法であって、 プロセッサ・システムが、ランダム・テキスト配列のセットを含む参照テキスト・データを生成することであって、前記ランダム・テキスト配列のセットの各テキスト配列はランダムな長さであり、かつある数のランダムな単語を含み、前記ランダムな長さの各々は最小の長さから最大の長さまでサンプリングされ、前記セット内の各テキスト配列の前記ランダムな単語は分布から抜き取られる、生成することと、 前記プロセッサ・システムが、前記ランダム・テキスト配列のセットと生テキスト・データとの間の計算された距離のセットに少なくとも部分的に基づいて、前記生テキスト・データに対する特徴行列を生成することと、 前記プロセッサ・システムが、前記特徴行列を1つ以上の機械学習モデルへの入力として提供することとを含む、方法。
IPC (1件):
G06N 20/00 ( 201 9.01)
FI (1件):
G06N 20/00 160

前のページに戻る