特許
J-GLOBAL ID:200903046173369463
音声認識システムおよび音声処理システム
発明者:
,
出願人/特許権者:
代理人 (1件):
特許業務法人池内・佐藤アンドパートナーズ
公報種別:公開公報
出願番号(国際出願番号):特願2005-243297
公開番号(公開出願番号):特開2007-057844
出願日: 2005年08月24日
公開日(公表日): 2007年03月08日
要約:
【課題】 ユーザが言い直し発声を行った場合に、人間同士の会話のように言い直しを正しく受理できる音声認識システムおよび音声処理システムを提供する。 【解決手段】 発話音声データを特徴量に変換する音響処理部11と、発話音声データから音声区間を判定する音声区間判定部12と、音声区間判定部12により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部18と、優先度判定部18により選択された音声区間の特徴量と音響モデルとを用いて、認識語彙との一致度を算出する照合部13とを備える。優先度判定部18は、前記所定の優先度判定基準として下記の少なくとも一つを用いる。 (1)音声区間長 (2)音声区間のパワーまたはSN比 (3)音声区間の時系列的な前後関係【選択図】 図1
請求項(抜粋):
入力された発話音声データを特徴量に変換する音響処理部と、
音声がどのような特徴量になりやすいかをモデル化した音響モデルを予め格納した音響モデル記憶部と、
認識語彙の情報を予め格納した語彙辞書記憶部と、
前記発話音声データから所定の音声区間判定基準により、音声区間を判定する音声区間判定部と、
前記音声区間判定部により判定された音声区間のうち、所定の優先度判定基準により、優先すべき音声区間を選択する優先度判定部と、
前記優先度判定部により選択された音声区間の前記特徴量と前記音響モデルを用いて、前記認識語彙との一致度を算出する照合部と、
照合部の照合した結果、最もスコアの良かった単語系列を認識結果として出力する結果出力部とを備え、
前記優先度判定部が、前記所定の優先度判定基準として、下記の(1)〜(3)から選ばれる少なくとも一つを用いることを特徴とする音声認識システム。
(1)音声区間長
(2)音声区間のパワーまたはSN比
(3)音声区間の時系列的な前後関係
IPC (5件):
G10L 15/08
, G10L 15/10
, G10L 11/02
, G10L 15/04
, G10L 15/22
FI (5件):
G10L3/00 531W
, G10L3/00 513A
, G10L3/00 513D
, G10L3/00 513B
, G10L3/00 571T
Fターム (3件):
5D015DD03
, 5D015HH11
, 5D015LL02
引用特許:
出願人引用 (1件)
-
音声認識装置
公報種別:公開公報
出願番号:特願平6-020044
出願人:ソニー株式会社
審査官引用 (9件)
-
特開平1-112299
-
音声認識装置及び音声認識方法
公報種別:公開公報
出願番号:特願平7-204215
出願人:株式会社リコー
-
音声認識方式
公報種別:公開公報
出願番号:特願平4-185452
出願人:株式会社東芝
-
特開昭63-165900
-
特開平4-166900
-
音声認識装置
公報種別:公開公報
出願番号:特願平6-169216
出願人:株式会社日立製作所
-
ワードスポッティング音声認識装置
公報種別:公開公報
出願番号:特願平4-264874
出願人:日本電信電話株式会社
-
特開昭62-217295
-
特開昭63-065499
全件表示
前のページに戻る