特許
J-GLOBAL ID:201203061973206184

コンテンツ検索装置及び方法及びプログラム

発明者:
出願人/特許権者:
代理人 (2件): 伊東 忠彦 ,  石原 隆治
公報種別:公開公報
出願番号(国際出願番号):特願2010-135606
公開番号(公開出願番号):特開2012-003356
出願日: 2010年06月14日
公開日(公表日): 2012年01月05日
要約:
【課題】 コンテンツを関連付ける対象領域を設定することなく、低コストでドキュメントの特定位置とコンテンツとを関連付ける。【解決手段】 本発明は、ドキュメントから、文字ブロックを抽出し、文字ブロックと該文字ブロックが出現するドキュメントにおけるページ識別子とページ内座標を関連付けてインデックスDBに出力する。入力された検索クエリ(ドキュメント内の一部領域)から抽出したクエリ文字ブロックに基づいてインデックスDBを検索し、検索結果をページ毎に集計し、最も多くの文字ブロックが検索されたページをヒットページとし、ヒットページ内で検索された文字ブロックのページ内座標の重心を算出し、ページ内ヒット位置とし、算出されたヒットページとページ内ヒット位置をクエリとして、ページ内ヒット位置の近傍のページ位置が関連付けられたコンテンツをコンテンツDBから検索する。【選択図】 図1
請求項(抜粋):
改ページや改行位置が確定しているドキュメント内の一部領域を検索クエリとして、該領域が出現するドキュメント及び該ドキュメント内における位置を取得し、取得した位置に関連付けられたコンテンツを提示するコンテンツ検索装置であって、 インデックス作成対象のドキュメントの入力を受け付けるドキュメント入力手段と、 入力された前記ドキュメントの全体または一部領域から、1文字以上の文字の組み合わせからなる文字ブロックを抽出する文字ブロック抽出手段と、 前記文字ブロックと該文字ブロックが出現するドキュメントにおけるページ識別子とページ内座標を関連付けてインデックスDBに出力するインデックス出力手段と、 あるドキュメント内の一部領域を検索クエリとして受け付けるクエリ入力手段と、 前記検索クエリから、1文字以上の文字の組み合わせからなるクエリ文字ブロックを抽出するクエリ文字ブロック抽出手段と、 前記クエリ文字ブロックに基づいて、前記インデックスDBを検索し、その検索結果を出力する検索手段と、 前記検索結果をページ毎に集計し、最も多くの文字ブロックが検索されたページをヒットページとし、ヒットページ内で検索された文字ブロックのページ内座標の重心を算出し、ページ内ヒット位置とする文字ブロック重心算出手段と、 ページ識別子とページ内位置と、その位置に関連付けられるコンテンツとの関係を格納したコンテンツDBと、 前記文字ブロック重心算出手段によって算出された前記ヒットページと前記ページ内ヒット位置をクエリとして、該ヒットページと一致するページ識別子で、該ページ内ヒット位置の近傍のページ位置が関連付けられたコンテンツを前記コンテンツDBから検索するコンテンツ検索手段と、 を有することを特徴とするコンテンツ検索装置。
IPC (1件):
G06F 17/30
FI (2件):
G06F17/30 310C ,  G06F17/30 414B
Fターム (7件):
5B075ND03 ,  5B075NK49 ,  5B075PP04 ,  5B075PP28 ,  5B075PQ02 ,  5B075PQ46 ,  5B075UU06
引用特許:
出願人引用 (4件)
全件表示

前のページに戻る