特許
J-GLOBAL ID:200903059011121004

連続音声認識処理方法およびその装置

発明者:
出願人/特許権者:
代理人 (1件): 田澤 博昭 (外2名)
公報種別:公開公報
出願番号(国際出願番号):特願平4-118543
公開番号(公開出願番号):特開平5-290101
出願日: 1992年04月13日
公開日(公表日): 1993年11月05日
要約:
【要約】【目的】 発話文章の認識率を改善し、使い易さも向上させた連続音声認識処理方法およびその装置を得る。【構成】 プラント機能階層化モデル、運転操作知識ベース、および対話履歴知識ベースを利用して常時プラントデータの評価を行い、運転員の注目範囲を絞り込んで運転員の発話時の発話の目的や内容を決定し、音声認識部の生成した複数の認識文章候補それぞれの発話の目的や内容を抽出して、前記注目範囲の絞り込みにて決定した発話の目的や内容と比較し、最終認識文章の決定を行う。【効果】 運転員によるプラントの運転状況も考慮した認識文章の決定が行われ、高精度で認識可能で、プラント監視操作盤などの運転操作性も改善できる。
請求項(抜粋):
単語を音声認識の基本単位として音声入力部より入力されたプラントの運転員の発話文章を処理し、得られた複数の認識文章候補の中から運転員の発話時における発話の目的や内容と一致もしくは類似度の高いものを選択する連続音声認識処理方法において、前記複数の認識文章候補に対して、プラントの運転員および設計者がプラント設計図書に基づいてプラントに対して持っている機能イメージを階層表現した知識ベースであるプラント機能階層化モデルの要素として表現された各プラント機能を、前記プラントの運転要領書に記載されている運転操作に関する知識と運転員の持つ運転操作に関する経験則を格納した運転操作知識ベースの知識に基づいて常時プラントデータに対応させて評価し、異常となっている前記プラント機能階層化モデル上の位置および各プラント機能の機能喪失状態を同定するとともに、これらの情報から運転員の注目している領域の絞り込みを行い、運転員の行うタスクを推定して、運転員の発話時における発話の目的や内容を決定し、前記複数の認識文章候補についても、運転員と当該システムとの対話の履歴を格納した対話履歴知識ベースの履歴情報、発話文章と前記プラント機能階層化モデルとの対応関係、発話文章あるいは発話単語と発話の目的との対応関係をもとに、前記各認識候補ごとの発話の目的や内容を抽出するとともに、その両者の比較を行って、前記各認識文章候補の中から運転員の発話時における発話の目的や内容と一致もしくは類似度の高い認識文章候補を選択することを特徴とする連続音声認識処理方法。
IPC (4件):
G06F 15/46 ,  G06F 15/38 ,  G10L 3/00 531 ,  G10L 3/00 561

前のページに戻る