特許
J-GLOBAL ID:201103015050984738

画像入り文書の検索システム及び検索方法

発明者:
出願人/特許権者:
代理人 (3件): 平木 祐輔 ,  関谷 三男 ,  渡辺 敏章
公報種別:公開公報
出願番号(国際出願番号):特願2010-120599
公開番号(公開出願番号):特開2011-248596
出願日: 2010年05月26日
公開日(公表日): 2011年12月08日
要約:
【課題】画像を含む文書群から、目的の画像、目的の画像を含む文書、目的の文書に関連する画像を高精度で検索する。【解決手段】文書中の各図を、当該図の特徴量を量子化した擬似単語と、当該図の説明箇所から抽出された用語とで表現した第1のインデックスを生成する。擬似単語及び/又は用語の共起頻度に基づいて、擬似単語及び/又は用語間の関係性の強さと擬似単語及び/又は用語の重要度とを計算する。その後、重要度を付した擬似単語及び/又は用語を重み付きノードとし、擬似単語及び/又は用語間の関係性の強さを付したエッジを重み付きエッジとして第2のインデックスを生成する。かかる前処理で生成された第2のインデックスを検索対象とし、重み付きノードと重み付きエッジで表現した加工済みクエリーとの類似度を表すスコア値を計算する。【選択図】図2
請求項(抜粋):
文書中の各図について、当該図の特徴量を量子化した擬似単語と、当該図の説明箇所から抽出された用語とで表現される第1のインデックスを生成する機能部と、 擬似単語及び/又は用語の共起頻度に基づいて、擬似単語及び/又は用語間の関係性の強さと擬似単語及び/又は用語の重要度とを計算する機能部と、 前記重要度を付した擬似単語及び/又は用語を重み付きノードとし、擬似単語及び/又は用語間の関係性の強さを付したエッジを重み付きエッジとして第2のインデックスを生成する機能部と、 検索クエリーから、重み付きノードと重み付きエッジで構成される加工済みクエリーを生成する機能部と、 重み付きノードと重み付きエッジで構成される前記第2のインデックスと前記加工済みクエリーとの類似度を表すスコアを計算することにより、検索クエリーに類似する図及び/又は文書を検索する機能部と を有することを特徴とする検索システム。
IPC (1件):
G06F 17/21
FI (2件):
G06F17/21 501Z ,  G06F17/21 546Z
Fターム (3件):
5B109NG04 ,  5B109QA08 ,  5B109VA02

前のページに戻る