Pat
J-GLOBAL ID:200903046173369463

音声認識システムおよび音声処理システム

Inventor:
Applicant, Patent owner:
Agent (1): 特許業務法人池内・佐藤アンドパートナーズ
Gazette classification:公開公報
Application number (International application number):2005243297
Publication number (International publication number):2007057844
Application date: Aug. 24, 2005
Publication date: Mar. 08, 2007
Summary:
【課題】 ユーザが言い直し発声を行った場合に、人間同士の会話のように言い直しを正しく受理できる音声認識システムおよび音声処理システムを提供する。 【解決手段】 発話音声データを特徴量に変換する音響処理部11と、発話音声データから音声区間を判定する音声区間判定部12と、音声区間判定部12により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部18と、優先度判定部18により選択された音声区間の特徴量と音響モデルとを用いて、認識語彙との一致度を算出する照合部13とを備える。優先度判定部18は、前記所定の優先度判定基準として下記の少なくとも一つを用いる。 (1)音声区間長 (2)音声区間のパワーまたはSN比 (3)音声区間の時系列的な前後関係【選択図】 図1
Claim (excerpt):
入力された発話音声データを特徴量に変換する音響処理部と、 音声がどのような特徴量になりやすいかをモデル化した音響モデルを予め格納した音響モデル記憶部と、 認識語彙の情報を予め格納した語彙辞書記憶部と、 前記発話音声データから所定の音声区間判定基準により、音声区間を判定する音声区間判定部と、 前記音声区間判定部により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部と、 前記優先度判定部により選択された音声区間の前記特徴量と前記音響モデルを用いて、前記認識語彙との一致度を算出する照合部と、 照合部の照合した結果、最もスコアの良かった単語系列を認識結果として出力する結果出力部とを備え、 前記優先度判定部が、前記所定の優先度判定基準として、下記の(1)〜(3)から選ばれる少なくとも一つを用いることを特徴とする音声認識システム。 (1)音声区間長 (2)音声区間のパワーまたはSN比 (3)音声区間の時系列的な前後関係
IPC (5):
G10L 15/08 ,  G10L 15/10 ,  G10L 11/02 ,  G10L 15/04 ,  G10L 15/22
FI (5):
G10L3/00 531W ,  G10L3/00 513A ,  G10L3/00 513D ,  G10L3/00 513B ,  G10L3/00 571T
F-Term (3):
5D015DD03 ,  5D015HH11 ,  5D015LL02
Patent cited by the Patent:
Cited by applicant (1)
  • 音声認識装置
    Gazette classification:公開公報   Application number:特願平6-020044   Applicant:ソニー株式会社
Cited by examiner (9)
  • 特開平1-112299
  • 音声認識装置及び音声認識方法
    Gazette classification:公開公報   Application number:特願平7-204215   Applicant:株式会社リコー
  • 音声認識方式
    Gazette classification:公開公報   Application number:特願平4-185452   Applicant:株式会社東芝
Show all

Return to Previous Page