特許
J-GLOBAL ID:200903007240661659

自動分類方法、自動分類プログラム、記録媒体、および、自動分類装置

発明者:
出願人/特許権者:
代理人 (1件): 磯野 道造
公報種別:公開公報
出願番号(国際出願番号):特願2004-296475
公開番号(公開出願番号):特開2006-107354
出願日: 2004年10月08日
公開日(公表日): 2006年04月20日
要約:
【課題】 複数の構成要素を有するコンテンツを、複数のカテゴリのいずれかに分類すること。【解決手段】 自動分類装置1が、コンテンツを各構成要素に分離して記憶手段に格納する構成要素分離手順と、訓練サンプルの構成要素を入力として構成要素ごとにカテゴリに対する帰属度を見積るモデルを構成し、それらのモデルを最適に結合して識別関数を生成する識別関数生成手順と、帰属するカテゴリが未知のコンテンツの構成要素と生成された識別関数を入力として、コンテンツの各構成要素のカテゴリに対する帰属度および帰属度間の結合パラメータをもとに、コンテンツが各カテゴリに属する確率を求め、その確率が最大となる最適なカテゴリを複数のカテゴリ候補の中から選択する自動分類手順と、を実行することを特徴とする。【選択図】 図1
請求項(抜粋):
タイトル、本文、引用文、リンク情報、画像を含む構成要素の群から選択される2つ以上の構成要素から形成されているコンテンツを分類する自動分類方法であって、コンピュータが、 帰属するカテゴリが既知のコンテンツを訓練サンプルとする訓練データ集合と、帰属するカテゴリが未知のコンテンツとを入力とし、それらのコンテンツを各構成要素に分離して記憶手段に格納する構成要素分離手順と、 前記訓練サンプルの構成要素を入力として構成要素ごとにカテゴリに対する帰属度を見積るモデルを構成し、それらのモデルを最適に結合して識別関数を生成する識別関数生成手順と、 帰属するカテゴリが未知のコンテンツの構成要素と生成された識別関数を入力として、前記コンテンツの各構成要素の前記カテゴリに対する帰属度および前記帰属度間の結合パラメータをもとに、記憶手段から読み出したコンテンツが各カテゴリに属する確率を求め、その確率が最大となる最適なカテゴリを複数のカテゴリ候補の中から選択する自動分類手順と、 を実行することを特徴とする自動分類方法。
IPC (2件):
G06F 17/30 ,  G06N 3/00
FI (2件):
G06F17/30 210D ,  G06N3/00 560A
Fターム (6件):
5B075ND03 ,  5B075ND06 ,  5B075ND36 ,  5B075NR12 ,  5B075QP01 ,  5B075UU06
引用文献:
出願人引用 (2件) 審査官引用 (2件)

前のページに戻る