特許
J-GLOBAL ID:201103057563900526

コンテンツ自動分類装置、コンテンツ自動分類方法およびコンテンツ自動分類プログラム

発明者:
出願人/特許権者:
代理人 (3件): 中尾 直樹 ,  草野 卓 ,  中村 幸雄
公報種別:公開公報
出願番号(国際出願番号):特願2010-007381
公開番号(公開出願番号):特開2011-145951
出願日: 2010年01月15日
公開日(公表日): 2011年07月28日
要約:
【課題】ラベルありサンプルの与え方に偏りがある場合でもコンテンツ自動分類の精度を向上させる。【解決手段】この発明のコンテンツ自動分類装置は、カテゴリが不明なコンテンツを入力として、そのコンテンツのカテゴリを分類するコンテンツ自動分類装置であって、識別関数生成部とコンテンツ分類部とを備え、識別関数生成部は、コンテンツとカテゴリの依存関係の強さを表す識別関数を、条件付確率モデルと同時確率モデルの重み付き統合で与え、識別関数のモデルパラメータである条件付確率モデルのパラメータと、同時確率モデルのパラメータと、重み付き統合の重みと、をラベルありサンプルとラベルなしサンプル双方の統計情報をもとに同時に計算する。【選択図】図1
請求項(抜粋):
カテゴリが不明なコンテンツを入力として、そのコンテンツのカテゴリを分類するコンテンツ自動分類装置であって、 コンテンツとカテゴリの依存関係の強さを表す識別関数を、条件付確率モデルP(y|x)と同時確率モデルp(x,y)との重み付き統合により構成し、コンテンツの属するカテゴリが既知のラベルありサンプル集合と、コンテンツの属するカテゴリが不明なラベルなしサンプル集合との統計情報をもとに、上記識別関数の同時確率モデルのパラメータΘ(t)と、条件付確率モデルのパラメータW(t)と、重みβ(t)、を同時に計算して求める識別関数生成部と、 上記コンテンツの特徴ベクトルと上記識別関数の各パラメータの推定値を入力としてその識別関数値を最大化させるカテゴリを求めて出力するコンテンツ分類部と、 を具備するコンテンツ自動分類装置。
IPC (3件):
G06F 17/30 ,  G06N 3/00 ,  G06N 5/04
FI (4件):
G06F17/30 210D ,  G06F17/30 350C ,  G06N3/00 560A ,  G06N5/04 580A
Fターム (3件):
5B075NR02 ,  5B075NR20 ,  5B075PR06
引用特許:
出願人引用 (1件)
引用文献:
前のページに戻る