特許
J-GLOBAL ID:200903060505821368

音声認識システム、データ処理装置、そのデータ処理方法及びプログラム

発明者:
出願人/特許権者:
代理人 (6件): 坂口 博 ,  市位 嘉宏 ,  上野 剛史 ,  古部 次郎 ,  千田 武 ,  久保 洋之
公報種別:公開公報
出願番号(国際出願番号):特願2003-405223
公開番号(公開出願番号):特開2005-165066
出願日: 2003年12月03日
公開日(公表日): 2005年06月23日
要約:
【課題】 音声認識によって書き起こされたテキストに対して修正が行われた場合でも、修正後のテキストと元の音声との間に適当な対応付けを行うことを可能とし、裁判や会議といった特殊な状況で取得された音声のテキストへの書き起こしに適したデータ処理方法およびこれを用いたシステムを提供する。 【解決手段】 音声データに対して、発話区間を特定し、各発話区間の音声認識を行い、得られた発話区間ごとの認識データの文字列と音声データとを発話時刻の情報により対応付ける音声認識処理部32と、この発話区間ごとの認識データをソートして作成されたテキストを表示出力する出力制御部34とを備え、さらに作成されたテキストを編集するテキスト編集部35と、編集されたテキスト中の文字列と音声データとの対応付けをダイナミックプログラミングの手法を用いて行う音声対応推定部36とをさらに備える。 【選択図】 図1
請求項(抜粋):
音声データを取得するためのマイクロフォンと、 前記マイクロフォンにて取得された音声データに対して、発話区間を特定し、各発話区間の音声認識を行い、得られた発話区間ごとの認識データの文字列と音声データとを発話時刻の情報により対応付ける音声認識処理部と、 前記音声認識処理部の処理により得られた発話区間ごとの前記認識データからテキストを作成するテキスト作成部と、 前記テキスト作成部にて作成された前記テキストを表示出力する出力制御部と を備えることを特徴とする音声認識システム。
IPC (5件):
G10L15/00 ,  G10L11/02 ,  G10L15/04 ,  G10L15/22 ,  G10L17/00
FI (4件):
G10L3/00 551B ,  G10L3/00 513A ,  G10L3/00 561C ,  G10L3/00 545Z
Fターム (9件):
5D015AA04 ,  5D015BB02 ,  5D015CC17 ,  5D015DD02 ,  5D015KK03 ,  5D015LL02 ,  5D015LL05 ,  5D015LL06 ,  5D015LL07
引用特許:
審査官引用 (11件)
全件表示

前のページに戻る