特許
J-GLOBAL ID:201103069715485340

チャネル統合方法、チャネル統合装置、プログラム

発明者:
出願人/特許権者:
代理人 (4件): 中尾 直樹 ,  中村 幸雄 ,  義村 宗洋 ,  草野 卓
公報種別:公開公報
出願番号(国際出願番号):特願2010-119853
公開番号(公開出願番号):特開2011-248025
出願日: 2010年05月25日
公開日(公表日): 2011年12月08日
要約:
【課題】複数のチャネルから音声認識に適した1のチャネルを選択し、選択されたチャネルの音声認識を行うチャネル統合方法、チャネル統合装置、プログラムを提供する。【解決手段】チャネルごとに音声信号を入力とし、音声ディジタル信号を出力する音声入力部12と、チャネルごとに音声ディジタル信号を入力とし、パワー値を出力するパワー計算部21と、チャネルごとに音声ディジタル信号、パワー値を入力とし、パワー値が最大となるチャネルの音声ディジタル信号を出力音声ディジタル信号として出力するチャネル選択部22と、出力音声ディジタル信号、音響モデル、言語モデルを入力とし、認識結果テキストを出力する音声認識部23と、出力音声ディジタル信号を入力とし、保存音声信号ファイル情報を出力する音声信号保存部25と、保存音声信号ファイル情報と認識結果テキストとを対応付けて保存する音声/テキスト保存部26とを備える。【選択図】図2
請求項(抜粋):
複数のチャネルから音声認識に適した1のチャネルを選択して、音声認識を行うチャネル統合方法であって、 チャネルごとの音声信号を入力とし、当該音声信号をアナログ-ディジタル変換により、チャネルごとに音声ディジタル信号に変換して出力する音声入力ステップと、 前記チャネルごとの音声ディジタル信号を入力とし、当該音声ディジタル信号のパワー値をチャネルごとに計算して出力するパワー計算ステップと、 前記チャネルごとの音声ディジタル信号と、前記チャネルごとのパワー値とを入力とし、当該パワー値が最大となるチャネルの音声ディジタル信号を選択して、出力音声ディジタル信号として出力するチャネル選択ステップと、 前記出力音声ディジタル信号と、音響モデルと、言語モデルとを入力とし、音声認識処理を行って認識結果テキストを生成し、当該認識結果テキストを時間情報と対応付けて出力する音声認識ステップと、 前記出力音声ディジタル信号を入力とし、当該出力音声ディジタル信号を保存して保存音声信号ファイル情報を生成し、当該保存音声信号ファイル情報を時間情報と対応付けて出力する音声信号保存ステップと、 前記保存音声信号ファイル情報と、前記認識結果テキストと、前記時間情報とを入力とし、前記時間情報を用いて、前記保存音声信号ファイル情報と前記認識結果テキストとを対応付けて保存する音声/テキスト保存ステップと、 を備えることを特徴とするチャネル統合方法。
IPC (3件):
G10L 15/04 ,  G10L 15/00 ,  G10L 15/20
FI (4件):
G10L15/04 300Z ,  G10L15/00 200A ,  G10L15/00 200U ,  G10L15/20 370E
Fターム (1件):
5D015EE04
引用特許:
出願人引用 (5件)
全件表示
審査官引用 (7件)
全件表示

前のページに戻る