Pat
J-GLOBAL ID:200903002280302765

音声認識装置、及びプログラム

Inventor:
Applicant, Patent owner:
Agent (1): 荒船 博司 (外1名)
Gazette classification:公開公報
Application number (International application number):2001012026
Publication number (International publication number):2002215184
Application date: Jan. 19, 2001
Publication date: Jul. 31, 2002
Summary:
【要約】【課題】 本発明の課題は、マイクから音声入力された会話情報に基づいて、会議や市場調査等のテキスト化されたデータベースを自動的に構築する音声認識装置、及びプログラムを提供することである。【解決手段】 音声認識装置1によれば、マイクMから入力された音声データを音声データ記憶部61に格納し、音素認識処理部21で音素データに変換した後に音素データ記憶部62に格納する。同時に、音素データを発声辞書学習処理部22で個人別発声辞書64、共通発声辞書65と照合し、照合結果を音素認識処理部21に渡す。また、音声データ記憶部61に格納された音素データを単語認識処理部24において単語認識した後に、認識された単語データを単語データ記憶部63に記憶する。
Claim (excerpt):
入力された音声データを記憶する音声記憶手段と、音声認識のための特徴情報を記憶する特徴情報記憶手段と、前記音声記憶手段に記憶されている音声データを読み出し、前記特徴情報記憶手段に記憶されている特徴情報に基づいて前記音声データに対応するテキストデータを推定するテキスト推定手段と、前記テキスト推定手段により推定されたテキストデータを、その推定の確度情報と共に記憶するテキスト記憶手段と、前記特徴情報記憶手段に記憶されている特徴情報を学習させる学習手段と、前記学習手段による特徴情報の学習後、前記テキスト記憶手段に記憶されているテキストデータの確度情報を読み出し、確度が一定割合以下であるテキストデータを前記テキスト推定手段によって再度推定し、前記テキスト記憶手段に記憶されているテキストデータを更新するテキスト更新手段と、を備えることを特徴とする音声認識装置。
IPC (6):
G10L 15/10 ,  G06F 3/16 320 ,  G06F 3/16 340 ,  G06F 17/28 ,  G06N 3/00 560 ,  G10L 15/06
FI (7):
G06F 3/16 320 H ,  G06F 3/16 340 C ,  G06F 17/28 V ,  G06N 3/00 560 G ,  G10L 3/00 531 K ,  G10L 3/00 521 F ,  G10L 3/00 521 S
F-Term (16):
5B091AA15 ,  5B091BA02 ,  5B091BA19 ,  5B091CA22 ,  5B091CB12 ,  5B091CB22 ,  5B091CC02 ,  5B091CD03 ,  5B091EA01 ,  5B091EA02 ,  5D015AA03 ,  5D015AA05 ,  5D015BB01 ,  5D015GG01 ,  5D015GG04 ,  5D015KK02

Return to Previous Page