特許
J-GLOBAL ID:200903011327347990
情報処理装置
発明者:
出願人/特許権者:
代理人 (1件):
國分 孝悦
公報種別:公開公報
出願番号(国際出願番号):特願2002-136019
公開番号(公開出願番号):特開2003-333509
出願日: 2002年05月10日
公開日(公表日): 2003年11月21日
要約:
【要約】【課題】 従来から考案されていた動画像の特徴的な場面を編集し、縮小画像による一覧を作成するという技術を拡張し、動画像が持つ音声データをテキストに変換して、画像データと共にテキストの印刷も行うことを目的とする。【解決手段】 音声データをテキストデータに変換する手段と、音声データの音の特徴を特徴別に分類する手段と、音声データが発生した時刻と、その特徴を元にテキスト文を作成するテキスト文作成手段と、印刷画像データの時刻と音声時刻とを元に画像に属するテキストを作成する画像テキスト作成手段を有する。
請求項(抜粋):
音声データの1つ1つを、テキストデータ、特徴データ、時刻データに変換し、音声情報として取得する音声情報取得手段と、音声情報の特徴を人、犬、風、車などのように分類する音声分類手段と、音声情報の分類データ別に音声特徴を保持する登場音声保持手段と、音声情報の時刻と特徴によって、テキストデータを編集しテキスト文を作成するテキスト文作成手段と、音声情報を特徴別にテキスト文データを保持する音声テキスト文データ保持手段とを備え、音声データを前記音声情報取得手段を用いて、1つ1つの音に対してテキストデータ、特徴データ、時刻データに変換された音声情報を取得し、音声情報から前記音声分類手段を用いて特徴を分類し、分類した音声情報の特徴情報が前記登場音声保持手段で既に登録されているかいないかを比較し、登録されていたら登録せず、未登録なら特徴データを登録し、さらに時刻データと特徴データ別にテキスト文を作成する前記テキスト文作成手段とを用い、前記音声テキスト文データ保持手段を用いて音声特徴別にテキスト文を保持することを特徴とする情報処理装置。
IPC (5件):
H04N 5/91
, G06F 3/16 320
, G10L 15/00
, G10L 15/22
, H04N 5/76
FI (5件):
G06F 3/16 320 H
, H04N 5/76 B
, H04N 5/91 N
, G10L 3/00 551 G
, G10L 3/00 561 C
Fターム (31件):
5C052AA01
, 5C052AA11
, 5C052AB02
, 5C052CC01
, 5C052DD02
, 5C052DD06
, 5C052FA02
, 5C052FA03
, 5C052FA05
, 5C052FB01
, 5C052FB08
, 5C052FC06
, 5C052FD06
, 5C052FE01
, 5C053FA04
, 5C053FA08
, 5C053FA14
, 5C053FA21
, 5C053FA23
, 5C053GB11
, 5C053GB21
, 5C053JA03
, 5C053JA05
, 5C053JA16
, 5C053KA03
, 5C053KA24
, 5C053KA26
, 5C053LA01
, 5C053LA03
, 5D015KK02
, 5D015LL00
前のページに戻る