特許
J-GLOBAL ID:200903046045855894

多言語音声認識方法、装置、プログラム、および多言語話者適応方法、装置、プログラム

発明者:
出願人/特許権者:
代理人 (2件): 草野 卓 ,  稲垣 稔
公報種別:公開公報
出願番号(国際出願番号):特願2002-261672
公開番号(公開出願番号):特開2004-101727
出願日: 2002年09月06日
公開日(公表日): 2004年04月02日
要約:
【課題】或る言語の音声を非母国語話者が発話した場合においても高い音声認識精度を確保し、高速動作する多言語音声認識方法、装置、プログラム、および多言語話者適応方法、装置、プログラムを提供する。【解決手段】認識対象の複数の言語の発音辞書102および対応する音響モデル103と、認識対象の複数の言語の発音辞書102で定義される単語を用いて作成された1つの多言語化された認識用文法104と、言語に独立な1つの音声分析部101および探索部105を備え、音声分析部101において入力音声から抽出された特徴パラメータに対して、探索部105において認識対象の複数の言語の音響モデルを用いて認識用文法で表現される単語列との間の照合を行い、照合スコアの最も高い単語列を認識結果として出力する多言語音声認識方法、装置、およびプログラム。【選択図】 図1
請求項(抜粋):
認識対象の複数の言語の発音辞書およびそれらに対応する音響モデルと、認識対象の複数の言語の発音辞書で定義される単語を用いて作成された1つの多言語化された認識用文法と、言語に独立な1つの音声分析部および探索部を備え、音声分析部において入力音声から抽出された特徴パラメータに対して、探索部において認識対象の複数の言語の音響モデルを用いて認識用文法で表現される単語列との間の照合を行い、照合スコアの最も高い単語列を認識結果として出力することを特徴とする多言語音声認識方法。
IPC (3件):
G10L15/10 ,  G10L15/06 ,  G10L15/18
FI (6件):
G10L3/00 531J ,  G10L3/00 521V ,  G10L3/00 537G ,  G10L3/00 537J ,  G10L3/00 521S ,  G10L3/00 521N
Fターム (4件):
5D015AA03 ,  5D015AA06 ,  5D015BB01 ,  5D015GG06
引用特許:
出願人引用 (3件)
  • 音声認識方法
    公報種別:公開公報   出願番号:特願2002-056306   出願人:ソニーインターナショナル(ヨーロッパ)ゲゼルシャフトミットベシュレンクテルハフツング
  • 音声認識方法及び装置
    公報種別:公開公報   出願番号:特願平11-371405   出願人:日本電信電話株式会社
  • 言語に依存しない音声認識
    公報種別:公表公報   出願番号:特願2000-559559   出願人:ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ
審査官引用 (3件)
  • 音声認識方法
    公報種別:公開公報   出願番号:特願2002-056306   出願人:ソニーインターナショナル(ヨーロッパ)ゲゼルシャフトミットベシュレンクテルハフツング
  • 音声認識方法及び装置
    公報種別:公開公報   出願番号:特願平11-371405   出願人:日本電信電話株式会社
  • 言語に依存しない音声認識
    公報種別:公表公報   出願番号:特願2000-559559   出願人:ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ

前のページに戻る