特許
J-GLOBAL ID:200903076400143287

同時に起こるマルチモード口述のための装置及び方法

発明者:
出願人/特許権者:
代理人 (1件): 山崎 行造 (外2名)
公報種別:公表公報
出願番号(国際出願番号):特願2000-536068
公開番号(公開出願番号):特表2002-507010
出願日: 1999年03月09日
公開日(公表日): 2002年03月05日
要約:
【要約】モードレスの大きい語彙の連続的音声認識システムは、一連の入力ベクトルとして入力発話を表すタイプのものである。そのシステムは、音響モデルを形成するシーケンス内の配列のための音響モデル状態の共通ライブラリーであって、各音響モデルが一連のセグメントモデルから構成され、各セグメントモデルが一連のモデル状態から構成される前記共通ライブラリーと、そのような状態がそのようなベクトルによって表される可能性を反映するセット内の各モデル状態のためのマッチスコアを生成するために、一連の入力ベクトル内の各ベクトルをその共通ライブラリー内のモデル状態のセットと比較する入力プロセッサと、複数の認識モジュール及び関連する認識文法であって、そのモジュールは、同時に作動し、各認識モジュール内の少なくとも一つの認識結果を決定するために、音響モデルのマッチスコアを使用し、この場合、その複数の認識モジュールが、少なくとも一つの有望な口述認識結果を作り出すための口述モジュールと、コマンドで処理するための視覚的に表示されたテキストの一部を認識するための選択モジュールと、少なくとも一つの有望なコマンド認識結果を作り出すためのコマンドモジュールとを含む前記複数の認識モジュール及び関連する認識文法と、少なくとも一つのシステム認識結果を選択するために、前記認識モジュールの前記認識結果を比較する関連する認識モジュールとともに、裁定アルゴリズム及び認識結果のスコアオーダーされた待ち行列を用いる裁定器とを含む。
請求項(抜粋):
一連の入力ベクトルとして入力発話を表すタイプのモードレスの大きい語彙の連続的音声認識システムを操作する方法であって、 (a)音響モデルを形成する順での配列のための音響モデル状態の共通ライブラリーを供給するステップと、 (b)そのような状態がそのようなベクトルによって表される可能性を反映するセット内の各モデル状態のためのマッチスコアを作り出すために、一連の入力ベクトル内の各ベクトルと共通ライブラリー内のモデル状態のセットとを比較するステップと、 (c)同時に作動する複数の認識モジュールにおいて、各認識モジュール内の少なくとも一つの認識結果を決定するために、音響モデルのマッチスコアを使用するステップと、 を有することを特徴とする方法。
IPC (2件):
G10L 15/18 ,  G10L 15/14
FI (3件):
G10L 3/00 537 J ,  G10L 3/00 535 Z ,  G10L 3/00 537 B
Fターム (3件):
5D015AA01 ,  5D015HH00 ,  5D015HH23

前のページに戻る