特許
J-GLOBAL ID:200903057359863079

ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体

発明者:
出願人/特許権者:
代理人 (1件): 伊東 忠彦
公報種別:公開公報
出願番号(国際出願番号):特願2005-142909
公開番号(公開出願番号):特開2006-318398
出願日: 2005年05月16日
公開日(公表日): 2006年11月24日
要約:
【課題】 ブログなどの個人の体験や感想が書かれた記事を精度よく分類するためのベクトルを生成する。【解決手段】 本発明は、学習用テキストを取得し、各テキストから単語を抽出し、蓄積されている検索語を含む単語集合を抽出し、単語集合の核単語の重要度を、検索語のランキングが高いほど重要度を高くする評価値を用いて算出し、カテゴリ毎の特徴ベクトルを算出して蓄積すると共に、該特徴ベクトルを構成する単語のリストを蓄積する。さらに、入力されたカテゴリが未知の分類対象テキストから、単語のリストに含まれる単語を抽出し、ベクトルに変換し、当該ベクトルと蓄積されている各カテゴリの特徴ベクトルとの類似度を求め、所定の閾値以上の類似度を持つカテゴリを分類対象テキストに付与する。【選択図】 図1
請求項(抜粋):
ネットワーク上に公開されている任意のテキストを、該テキストが帰属する1つまたは複数のカテゴリに分類するための、検索語蓄積手段、学習用テキスト蓄積手段、単語抽出手段、及び、ベクトル変換手段と、を有するベクトル生成装置における、ベクトル生成方法において、 前記単語抽出手段において、ある期間においてランキングされた検索語と該検索語のランキングの組が蓄積された前記検索語蓄積手段からある期間の検索語を抽出し、学習用テキストが蓄積された前記学習用テキスト蓄積手段から単語を抽出し、また、入力された分類対象テキストから単語を抽出する単語抽出ステップと、 前記ベクトル変換手段において、前記単語抽出ステップで前記学習用テキスト及び前記分類対象テキストから抽出された単語を前記検索語を含むベクトルに変換する変換ステップと、 を行うことを特徴とするベクトル生成方法。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 210D ,  G06F17/30 170A
Fターム (8件):
5B075ND03 ,  5B075NK32 ,  5B075NR02 ,  5B075NR12 ,  5B075PR06 ,  5B075QM08 ,  5B075QP10 ,  5B075UU40
引用特許:
出願人引用 (1件)
  • 特許第3488063
審査官引用 (1件)
引用文献:
前のページに戻る