特許
J-GLOBAL ID:200903068379734595

メタ情報生成方法、メタ情報生成装置、検索方法および検索装置

発明者:
出願人/特許権者:
代理人 (6件): 鈴江 武彦 ,  河野 哲 ,  中村 誠 ,  蔵田 昌俊 ,  村松 貞男 ,  橋本 良郎
公報種別:公開公報
出願番号(国際出願番号):特願2003-320940
公開番号(公開出願番号):特開2005-092295
出願日: 2003年09月12日
公開日(公表日): 2005年04月07日
要約:
【課題】映像データと音声データからなるコンテンツデータに音声認識の信頼度が低い区間が混じっている場合においても、検索漏れや誤検索を回避できる検索装置を提供する。【解決手段】コンテンツデータの各区間について、当該区間の識別子と、当該区間の音声の音声認識結果である音声テキストと、音声テキストの信頼度として高いか低いかのいずれか一方と、音声テキストから抽出されたキーワードと当該キーワードの属するカテゴリとを記述した要素データとを含むメタ情報を記憶し、第1の文字列と第2の文字列が検索条件であるとき、信頼度が高いメタ情報のなかから、第1の文字列と同音のカテゴリと第2の文字列と同音のキーワードとを記述した要素データを含むメタ情報を検索し、第2の文字列のみが検索条件であるとき、第2の文字列と同音かあるいは類似する音をもつ複数の第3の文字列のうちのいずれかを音声テキストに含むメタ情報を検索する。【選択図】 図1
請求項(抜粋):
映像データと音声データを含むコンテンツデータの特徴を記述した複数の要素データからなるメタ情報を生成するメタ情報生成方法であって、 複数の区間に区切られた前記コンテンツデータの当該複数の区間のそれぞれについて、当該区間の音声データの音声認識結果である音声テキストと当該区間の映像データに含まれるテロップの文字認識結果であるテロップテキストを求める第1のステップと、 前記音声テキストから当該音声テキストに含まれるキーワードと当該キーワードの属するカテゴリを求める第2のステップと、 前記複数の各区間のそれぞれについて、当該区間から求めた前記音声テキストと前記テロップテキストの両方に同音語が含まれるとき当該区間の前記音声テキストに対する信頼度は高いと判定し、同音語が含まれていないとき当該区間の前記音声テキストに対する信頼度は低いと判定する第3のステップと、 前記複数の各区間のそれぞれについて、少なくとも当該区間の識別子を記述した第1の要素データと、前記音声テキストを記述した第2の要素データと、当該音声テキストに対する信頼度を記述した第3の要素データと、当該音声テキストに前記キーワードが含まれているときには当該キーワードと当該キーワードの属する前記カテゴリとを記述した第4の要素データとを含む前記メタ情報を生成する第4のステップと、 を有することを特徴とするメタ情報生成方法。
IPC (5件):
G06F17/30 ,  G06K9/00 ,  G10L15/00 ,  G10L15/08 ,  G10L15/10
FI (5件):
G06F17/30 220C ,  G06F17/30 170G ,  G06K9/00 S ,  G10L3/00 531W ,  G10L3/00 551G
Fターム (12件):
5B064AA07 ,  5B064BA01 ,  5B075ND08 ,  5B075ND12 ,  5B075ND16 ,  5B075NK02 ,  5B075NK21 ,  5B075NK31 ,  5B075NK35 ,  5B075PQ02 ,  5B075UU34 ,  5D015AA04
引用特許:
出願人引用 (1件)
  • コンテンツ検索装置
    公報種別:公開公報   出願番号:特願2000-039691   出願人:日本電信電話株式会社

前のページに戻る