特許
J-GLOBAL ID:200903001632206986
音声記録指標化装置及び方法
発明者:
,
,
,
,
,
出願人/特許権者:
代理人 (1件):
合田 潔 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平6-204690
公開番号(公開出願番号):特開平7-199379
出願日: 1994年08月30日
公開日(公表日): 1995年08月04日
要約:
【要約】【目的】 作成トランスクリプトをビデオ及び音声クリップ内の音声により自動的に位置合わせする方法を提供すること。【構成】 開示される技術は基本コンポーネントとして自動音声認識装置103を含む。自動音声認識装置103は音声(テープ上に記録される)をデコードし、デコード・テキスト38によるファイルを生成する。このデコード・テキスト38は次に、類似語または語のクラスタの識別を介して、オリジナルの作成トランスクリプトと照合される。この照合の結果、音声がオリジナルのトランスクリプトにより位置合わせされる。本方法は、(a)ビデオ・クリップの指標化の生成、(b) "テレプロンプティング(teleprompting)"(すなわち誰かがテレビジョン画面から読出している時に、テキストの次の部分を示す)、或いは(c)タイピストによる後のテキスト再生のために速記者に口授された、またはテープ上に記録されたテキストの編集の改良に使用される。
請求項(抜粋):
音声記録を指標化する装置であって、各々が少なくとも1つの音響情報信号単位を記憶する複数の記録ロケーションを有し、話言葉から生成される音を表す順序付けられた一連の音響情報信号単位を記憶する音響記録装置と、音響情報信号により表される音の発生が提供されると、発生の高い条件確率を有する順序付けられた一連の認識語(各認識語が少なくとも1つの音響情報信号単位に対応し、少なくとも1つの先行するまたは後続の認識語のコンテキストを有する)を生成する音声認識装置と、音響情報信号単位により表される少なくとも幾つかの話言葉の可視表現を含む、順序付けられた一連の指標語(各指標語が少なくとも1つの先行するまたは後続の指標語のコンテキストを有する)を記憶するテキスト記憶装置と、順序付けられた一連の認識語を順序付けられた一連の指標語と比較し、双方が同一語に相当し、マッチングするコンテキストを有する認識語と指標語とを対にし、各対にされる指標語に、該指標語と対を成す認識語に対応する音響情報信号単位の記録ロケーションをタグ付けする手段と、を含む装置。
IPC (3件):
G03B 31/00
, G06F 17/30
, G10L 3/00 551
引用特許:
前のページに戻る