特許
J-GLOBAL ID:200903075206304664
音声認識方法及び音声認識装置
発明者:
,
,
出願人/特許権者:
代理人 (1件):
石田 敬 (外4名)
公報種別:公表公報
出願番号(国際出願番号):特願2000-594107
公開番号(公開出願番号):特表2002-535708
出願日: 2000年01月17日
公開日(公表日): 2002年10月22日
要約:
【要約】音声認識時に音声内のポーズを検出する方法において、ユーザーが発声した音声コマンドを認識するために、音声を電気信号に変換し、その周波数スぺクトルを2つまたはそれ以上のサブバンドに分割する。サブバンドの信号のサンプルを間隔をおいて格納し、その格納されたサンプルに基づいてサブバンドのエネルギー・レベルを決定し、電力閾値(thr)を決定し、サブバンドのエネルギー・レベルを前記電力閾値(thr)と比較する。ポーズ検出結果を作り出すためにこの比較結果を用いる。
請求項(抜粋):
音声認識時に音声内のポーズを検出する方法であって、ユーザーが発声した音声コマンドを認識するために音声を電気信号に変換する方法において、前記電気信号の周波数スぺクトルを2つまたはそれ以上のサブバンドに分割し、前記サブバンド内の信号のサンプルを間隔をおいて格納し、その格納されたサンプルに基づいて前記サブバンドのエネルギー・レベルを決定し、電力閾値(thr)を決定し、前記サブバンドの前記エネルギー・レベルを前記電力閾値(thr)と比較し、ポーズ検出結果を作り出すために前記比較結果を利用することを特徴とする方法。
IPC (4件):
G10L 11/02
, G06F 3/16 320
, G10L 15/00
, G10L 15/04
FI (3件):
G06F 3/16 320 F
, G10L 3/00 513 A
, G10L 3/00 551 A
Fターム (2件):
引用特許:
審査官引用 (7件)
-
特開平3-253899
-
特開昭62-204300
-
特開平2-278298
-
音声検出方法
公報種別:公開公報
出願番号:特願平4-328329
出願人:富士通株式会社
-
特開昭56-051794
-
特開昭58-175157
-
特開昭59-228300
全件表示
前のページに戻る