特許
J-GLOBAL ID:201603007399670034

情報処理システム、及び、情報処理方法

発明者:
出願人/特許権者:
代理人 (2件): 藤井 正弘 ,  後藤 政喜
公報種別:特許公報
出願番号(国際出願番号):特願2012-204680
公開番号(公開出願番号):特開2014-059754
特許番号:特許第5881048号
出願日: 2012年09月18日
公開日(公表日): 2014年04月03日
請求項(抜粋):
【請求項1】 複数の文献データについて機械学習を行う情報処理システムであって、 前記情報処理システムは、 ラベルを付与された複数の文献データである複数の教師データと、前記ラベルを付与されていない文献データであるラベル無しデータと、前記各文献データに関する複数の素性を抽出する方法を示す複数の素性タイプと、を取得する初期化部と、 前記取得された素性タイプのうち少なくとも一つの前記素性タイプが入力された場合、前記入力された素性タイプと、前記取得された各教師データとに基づいて、前記各教師データに関する素性を数値ベクトルによって示す、前記各教師データの素性ベクトルを生成する素性ベクトル生成部と、 前記素性ベクトル生成部によって生成された各教師データの素性ベクトルに基づいて、前記素性ベクトルが示す複数のノードと前記複数のノード間の距離に従って重みが定められたエッジとからなる前記教師データのグラフを生成するグラフ構築部と、 前記グラフ構築部によって生成された教師データのグラフの前記重みに従って、前記教師データのグラフを評価する素性評価部を有し、前記素性評価部による前記グラフの評価結果に従って、前記教師データのラベルを正確に伝搬させる第1のグラフを生成するための素性タイプを、前記初期化部によって取得された素性タイプから選択し、さらに、前記グラフ構築部に生成させた前記第1のグラフを出力する素性選択部と、を有し、 前記素性ベクトル生成部は、前記第1のグラフが生成された前記素性タイプと、前記初期化部によって取得された複数のラベル無しデータとに基づいて、前記各ラベル無しデータに関する素性を数値ベクトルによって示す、前記ラベル無しデータの素性ベクトルを生成し、 前記情報処理システムは、 前記各教師データの素性ベクトルと前記各ラベル無しデータの素性ベクトルとに基づいて、前記第1のグラフに含まれる各教師データと、前記各ラベル無しデータとの距離を算出し、前記教師データに付与されたラベルが伝搬される前記ラベル無しデータを、前記第1のグラフに含まれる各教師データと各ラベル無しデータとの距離に基づいて選択し、さらに、前記選択されたラベル無しデータを前記第1のグラフに含めることによって、第2のグラフを生成するデータ選択部と、 前記第2のグラフによって、前記教師データに付与されたラベルを、前記選択されたラベル無しデータに伝搬させる機械学習部と、を有することを特徴とする情報処理システム。
IPC (2件):
G06F 17/27 ( 200 6.01) ,  G06F 17/30 ( 200 6.01)
FI (4件):
G06F 17/27 615 ,  G06F 17/30 170 A ,  G06F 17/30 220 Z ,  G06F 17/30 419 B
引用特許:
出願人引用 (1件) 審査官引用 (1件)
引用文献:
前のページに戻る