Pat
J-GLOBAL ID:200903068379734595
メタ情報生成方法、メタ情報生成装置、検索方法および検索装置
Inventor:
,
,
,
Applicant, Patent owner:
Agent (6):
鈴江 武彦
, 河野 哲
, 中村 誠
, 蔵田 昌俊
, 村松 貞男
, 橋本 良郎
Gazette classification:公開公報
Application number (International application number):2003320940
Publication number (International publication number):2005092295
Application date: Sep. 12, 2003
Publication date: Apr. 07, 2005
Summary:
【課題】映像データと音声データからなるコンテンツデータに音声認識の信頼度が低い区間が混じっている場合においても、検索漏れや誤検索を回避できる検索装置を提供する。【解決手段】コンテンツデータの各区間について、当該区間の識別子と、当該区間の音声の音声認識結果である音声テキストと、音声テキストの信頼度として高いか低いかのいずれか一方と、音声テキストから抽出されたキーワードと当該キーワードの属するカテゴリとを記述した要素データとを含むメタ情報を記憶し、第1の文字列と第2の文字列が検索条件であるとき、信頼度が高いメタ情報のなかから、第1の文字列と同音のカテゴリと第2の文字列と同音のキーワードとを記述した要素データを含むメタ情報を検索し、第2の文字列のみが検索条件であるとき、第2の文字列と同音かあるいは類似する音をもつ複数の第3の文字列のうちのいずれかを音声テキストに含むメタ情報を検索する。【選択図】 図1
Claim (excerpt):
映像データと音声データを含むコンテンツデータの特徴を記述した複数の要素データからなるメタ情報を生成するメタ情報生成方法であって、
複数の区間に区切られた前記コンテンツデータの当該複数の区間のそれぞれについて、当該区間の音声データの音声認識結果である音声テキストと当該区間の映像データに含まれるテロップの文字認識結果であるテロップテキストを求める第1のステップと、
前記音声テキストから当該音声テキストに含まれるキーワードと当該キーワードの属するカテゴリを求める第2のステップと、
前記複数の各区間のそれぞれについて、当該区間から求めた前記音声テキストと前記テロップテキストの両方に同音語が含まれるとき当該区間の前記音声テキストに対する信頼度は高いと判定し、同音語が含まれていないとき当該区間の前記音声テキストに対する信頼度は低いと判定する第3のステップと、
前記複数の各区間のそれぞれについて、少なくとも当該区間の識別子を記述した第1の要素データと、前記音声テキストを記述した第2の要素データと、当該音声テキストに対する信頼度を記述した第3の要素データと、当該音声テキストに前記キーワードが含まれているときには当該キーワードと当該キーワードの属する前記カテゴリとを記述した第4の要素データとを含む前記メタ情報を生成する第4のステップと、
を有することを特徴とするメタ情報生成方法。
IPC (5):
G06F17/30
, G06K9/00
, G10L15/00
, G10L15/08
, G10L15/10
FI (5):
G06F17/30 220C
, G06F17/30 170G
, G06K9/00 S
, G10L3/00 531W
, G10L3/00 551G
F-Term (12):
5B064AA07
, 5B064BA01
, 5B075ND08
, 5B075ND12
, 5B075ND16
, 5B075NK02
, 5B075NK21
, 5B075NK31
, 5B075NK35
, 5B075PQ02
, 5B075UU34
, 5D015AA04
Patent cited by the Patent:
Cited by applicant (1)
-
コンテンツ検索装置
Gazette classification:公開公報
Application number:特願2000-039691
Applicant:日本電信電話株式会社
Return to Previous Page