特許
J-GLOBAL ID:200903069548115464

音声認識装置

発明者:
出願人/特許権者:
代理人 (1件): 足立 勉
公報種別:公開公報
出願番号(国際出願番号):特願2001-090373
公開番号(公開出願番号):特開2002-287792
出願日: 2001年03月27日
公開日(公表日): 2002年10月04日
要約:
【要約】【課題】音声入力対象が階層的構造の場合、訂正の際に全部を再入力しなくてもよいようにし、且つ認識率の低下を防止する。【解決手段】音声情報保持部41は音声入力部27から入力された音声情報を保持しておく。訂正のための音声入力がなされた場合、比較・判定部42は今回入力された音声情報と音声情報保持部41に保持しておいた前回の音声情報とを比較して両者の似ている部分を判定する。音声認識部30の辞書制御部34では、前回結果記憶部33に記憶されている認識結果も用いて訂正箇所に対応する部分のみを比較対象パターン候補とする辞書制御を行う。例えば「愛知県刈谷市昭和(しょうわ)町」が「愛知県刈谷市松栄(しょうえい)町」と誤認識され、訂正のために「昭和町」と音声入力した場合、愛知県刈谷市に続く町名部分(具体的には、昭和町、松栄町......など)のみを比較対象パターン候補とする。
請求項(抜粋):
音声を入力するための音声入力手段と、該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする認識手段と、該認識手段による認識結果を報知する報知手段と、該報知手段によって認識結果が報知された後に所定の確定指示がなされた場合には、当該認識結果を確定したものとして所定の確定後処理を実行する確定後処理手段とを備え、前記辞書手段に記憶されている前記複数の比較対象パターン候補の内の少なくとも一つは、複数の語を階層的につなぎ合わせたものとして設定されている音声認識装置であって、前記音声入力手段を介して前回の発声時に入力された音声情報を保持しておく音声情報保持手段と、前記報知手段による認識結果報知後に所定の確定指示がなされずに、前記音声入力手段を介した音声入力があった場合には、前記音声入力手段を介して今回の発声時に入力された音声情報と前記音声情報保持手段に保持された前回の発声時の音声情報とを比較し、今回発声時の音声情報が前回発声時の音声情報のどの部分と最も近いかを判定して、その最も近い部分を訂正箇所とする訂正箇所判定手段とを備え、前記訂正箇所判定手段によって訂正個所と判定された部分が、前記複数の語を階層的につなぎ合わせた比較対象パターン候補の一部の階層に相当する場合は、前記認識手段が、その一部階層の構成語又は語群を一時的に前記比較対象パターン候補とみなした上で、前記入力音声に対する比較を実行するよう構成されていることを特徴とする音声認識装置。
IPC (6件):
G10L 15/22 ,  B60R 11/02 ,  G10L 15/06 ,  G10L 15/18 ,  G10L 15/00 ,  G10L 15/28
FI (8件):
B60R 11/02 M ,  B60R 11/02 C ,  G10L 3/00 561 E ,  G10L 3/00 521 W ,  G10L 3/00 537 F ,  G10L 3/00 551 Q ,  G10L 3/00 561 C ,  G10L 3/00 561 D
Fターム (14件):
3D020BA04 ,  3D020BA11 ,  3D020BC02 ,  3D020BD03 ,  3D020BE03 ,  5D015AA01 ,  5D015HH07 ,  5D015HH23 ,  5D015KK01 ,  5D015KK04 ,  5D015LL04 ,  5D015LL05 ,  5D015LL06 ,  5D015LL08
引用特許:
出願人引用 (8件)
全件表示
審査官引用 (8件)
全件表示

前のページに戻る