特許
J-GLOBAL ID:200903015202566424

音声処理装置および音声処理方法、並びに記録媒体

発明者:
出願人/特許権者:
代理人 (1件): 稲本 義雄
公報種別:公開公報
出願番号(国際出願番号):特願平11-277745
公開番号(公開出願番号):特開2001-100781
出願日: 1999年09月30日
公開日(公表日): 2001年04月13日
要約:
【要約】【課題】 音声認識に用いるモデルの適応を、ユーザに負担をかけることなく、かつ精度良く行う。【解決手段】 音声認識部1では、そこに入力される音声が、例えば、HMM(Hidden Markov Model)等のモデルに基づいて音声認識され、その音声認識結果が、対話管理部5に供給される。対話管理部5では、音声認識部1からの音声認識結果に対する返答が生成される。この場合において、対話管理部5は、音声認識部1からの音声認識結果と、その返答とに基づいて、音声認識結果が正しい音声区間を検出し、その音声区間を、音声認識部1にフィードバックする。音声認識部1では、対話管理部5からフィードバックされる音声区間の音声と、その音声認識結果に基づいて、モデルのオンライン適応が行われる。
請求項(抜粋):
音声を音声認識する音声認識手段と、前記音声認識手段による音声認識結果を対象として自然言語処理を行う自然言語処理手段とを備える音声処理装置であって、前記自然言語処理手段は、前記音声認識結果を対象とする自然言語処理によって得られる情報を、前記音声認識手段に対してフィードバックするフィードバック手段を含み、前記音声認識手段は、前記フィードバック手段からフィードバックされる情報に基づいて処理を行う処理手段を含むことを特徴とする音声処理装置。
IPC (4件):
G10L 15/06 ,  G06F 17/28 ,  G10L 15/18 ,  G10L 15/00
FI (4件):
G10L 3/00 521 F ,  G06F 15/38 V ,  G10L 3/00 537 Z ,  G10L 3/00 551 C
Fターム (17件):
5B091AA15 ,  5B091CB12 ,  5B091EA01 ,  5D015AA05 ,  5D015BB02 ,  5D015GG01 ,  5D015HH00 ,  5D015HH04 ,  5D015KK04 ,  5D015LL04 ,  5D015LL06 ,  9A001BB06 ,  9A001DD15 ,  9A001HH14 ,  9A001HH17 ,  9A001HH18 ,  9A001KK46

前のページに戻る