特許
J-GLOBAL ID:200903002280302765

音声認識装置、及びプログラム

発明者:
出願人/特許権者:
代理人 (1件): 荒船 博司 (外1名)
公報種別:公開公報
出願番号(国際出願番号):特願2001-012026
公開番号(公開出願番号):特開2002-215184
出願日: 2001年01月19日
公開日(公表日): 2002年07月31日
要約:
【要約】【課題】 本発明の課題は、マイクから音声入力された会話情報に基づいて、会議や市場調査等のテキスト化されたデータベースを自動的に構築する音声認識装置、及びプログラムを提供することである。【解決手段】 音声認識装置1によれば、マイクMから入力された音声データを音声データ記憶部61に格納し、音素認識処理部21で音素データに変換した後に音素データ記憶部62に格納する。同時に、音素データを発声辞書学習処理部22で個人別発声辞書64、共通発声辞書65と照合し、照合結果を音素認識処理部21に渡す。また、音声データ記憶部61に格納された音素データを単語認識処理部24において単語認識した後に、認識された単語データを単語データ記憶部63に記憶する。
請求項(抜粋):
入力された音声データを記憶する音声記憶手段と、音声認識のための特徴情報を記憶する特徴情報記憶手段と、前記音声記憶手段に記憶されている音声データを読み出し、前記特徴情報記憶手段に記憶されている特徴情報に基づいて前記音声データに対応するテキストデータを推定するテキスト推定手段と、前記テキスト推定手段により推定されたテキストデータを、その推定の確度情報と共に記憶するテキスト記憶手段と、前記特徴情報記憶手段に記憶されている特徴情報を学習させる学習手段と、前記学習手段による特徴情報の学習後、前記テキスト記憶手段に記憶されているテキストデータの確度情報を読み出し、確度が一定割合以下であるテキストデータを前記テキスト推定手段によって再度推定し、前記テキスト記憶手段に記憶されているテキストデータを更新するテキスト更新手段と、を備えることを特徴とする音声認識装置。
IPC (6件):
G10L 15/10 ,  G06F 3/16 320 ,  G06F 3/16 340 ,  G06F 17/28 ,  G06N 3/00 560 ,  G10L 15/06
FI (7件):
G06F 3/16 320 H ,  G06F 3/16 340 C ,  G06F 17/28 V ,  G06N 3/00 560 G ,  G10L 3/00 531 K ,  G10L 3/00 521 F ,  G10L 3/00 521 S
Fターム (16件):
5B091AA15 ,  5B091BA02 ,  5B091BA19 ,  5B091CA22 ,  5B091CB12 ,  5B091CB22 ,  5B091CC02 ,  5B091CD03 ,  5B091EA01 ,  5B091EA02 ,  5D015AA03 ,  5D015AA05 ,  5D015BB01 ,  5D015GG01 ,  5D015GG04 ,  5D015KK02

前のページに戻る