音声認識システムおよび音声処理システム

発明者： ,
出願人/特許権者：
代理人 (1件)：特許業務法人池内・佐藤アンドパートナーズ
公報種別：公開公報
出願番号（国際出願番号）：特願2005-243297
公開番号（公開出願番号）：特開2007-057844
出願日： 2005年08月24日
公開日（公表日）： 2007年03月08日
要約：

【課題】ユーザが言い直し発声を行った場合に、人間同士の会話のように言い直しを正しく受理できる音声認識システムおよび音声処理システムを提供する。【解決手段】発話音声データを特徴量に変換する音響処理部11と、発話音声データから音声区間を判定する音声区間判定部12と、音声区間判定部12により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部18と、優先度判定部18により選択された音声区間の特徴量と音響モデルとを用いて、認識語彙との一致度を算出する照合部13とを備える。優先度判定部18は、前記所定の優先度判定基準として下記の少なくとも一つを用いる。 (1)音声区間長 (2)音声区間のパワーまたはSN比 (3)音声区間の時系列的な前後関係【選択図】図1

請求項（抜粋）：

入力された発話音声データを特徴量に変換する音響処理部と、音声がどのような特徴量になりやすいかをモデル化した音響モデルを予め格納した音響モデル記憶部と、認識語彙の情報を予め格納した語彙辞書記憶部と、前記発話音声データから所定の音声区間判定基準により、音声区間を判定する音声区間判定部と、前記音声区間判定部により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部と、前記優先度判定部により選択された音声区間の前記特徴量と前記音響モデルを用いて、前記認識語彙との一致度を算出する照合部と、照合部の照合した結果、最もスコアの良かった単語系列を認識結果として出力する結果出力部とを備え、前記優先度判定部が、前記所定の優先度判定基準として、下記の(1)〜(3)から選ばれる少なくとも一つを用いることを特徴とする音声認識システム。 (1)音声区間長 (2)音声区間のパワーまたはSN比 (3)音声区間の時系列的な前後関係

IPC (5件)：

G10L 15/08 , G10L 15/10 , G10L 11/02 , G10L 15/04 , G10L 15/22

FI (5件)：

G10L3/00 531W , G10L3/00 513A , G10L3/00 513D , G10L3/00 513B , G10L3/00 571T

Fターム (3件)：

5D015DD03 , 5D015HH11 , 5D015LL02

引用特許：

出願人引用 (1件)

音声認識装置
公報種別：公開公報出願番号：特願平6-020044 出願人：ソニー株式会社

審査官引用 (9件)

特開平1-112299
音声認識装置及び音声認識方法
公報種別：公開公報出願番号：特願平7-204215 出願人：株式会社リコー
音声認識方式
公報種別：公開公報出願番号：特願平4-185452 出願人：株式会社東芝

全件表示

前のページに戻る