特許
J-GLOBAL ID:200903041197560073

音声認識用音響モデル配信方式

発明者:
出願人/特許権者:
公報種別:公開公報
出願番号(国際出願番号):特願2001-189776
公開番号(公開出願番号):特開2003-005782
出願日: 2001年06月22日
公開日(公表日): 2003年01月08日
要約:
【要約】【課題】 確率が高く、利用者に音響モデルを提供するために必要な計算コストの期待値を低減化した音声認識用音響モデル配信方式を得る。【解決手段】 サウンドボードのA/D変換装置などのディジタル録音装置2を有する利用者のパソコン1と、大量の音声データを用いて不特定話者用音響モデルを学習するホストコンピュータ4と、その間を結ぶネットワークとを有する系から構成されるシステムを利用する。利用者から提出された録音周波数特性データ3に基づき、ホストコンピュータ4上で接続された音声データベース6に保存されている大量の音声データに対して周波数特性を補正するためのフィルタリング処理と、ダウンサンプリング処理を行い各処理後の学習履歴データベース5を用いて音響モデルを学習し、学習後のモデルを利用者に提供する。これにより、利用者のパソコン1が有する録音周波数特性に適した不特定話者用音響モデルを提供する。
請求項(抜粋):
サウンドボードのA/D変換装置を含むディジタル録音装置を具備する利用者のパソコンと、音声データを用いて不特定話者用音響モデルを学習するホストコンピュータと、前記利用者のパソコンと前記ホストコンピュータとの接続を介するネットワークと、を有するシステムにおける音声認識用音響モデル配信方式であって、前記ホストコンピュータは、前記利用者から前記ホストコンピュータに提出された前記利用者のパソコンにおける録音周波数特性情報に基づいて、前記ホストコンピュータに接続された外部記憶装置に保存されている音声データに対して周波数特性を補正するためのフィルタリング処理と、ダウンサンプリング処理とを行い、前記各処理後のデータを用いて音響モデルを学習し、該学習後の音響モデルを前記利用者のパソコンに送信することにより、前記利用者のパソコンに実装された前記ディジタル録音装置が有する前記録音周波数特性に適した前記不特定話者用音響モデルを前記利用者に提供することを特徴とする音声認識用音響モデル配信方式。
IPC (4件):
G10L 15/06 ,  G10K 15/02 ,  G10L 15/00 ,  G10L 15/28
FI (4件):
G10K 15/02 ,  G10L 3/00 521 T ,  G10L 3/00 551 P ,  G10L 3/00 561 H
Fターム (3件):
5D015GG00 ,  5D015KK02 ,  5D015LL12

前のページに戻る