音声認識装置および文分類装置としてコンピュータを動作させるコンピュータプログラム、階層化された言語モデルを作成する方法を実現する様にコンピュータを動作させるコンピュータプログラム、および記憶媒体

Inventor： , , ,
Applicant, Patent owner：
Agent (1)：清水敏
Gazette classification：公開公報
Application number (International application number)：2002365074
Publication number (International publication number)：2004198597
Application date： Dec. 17, 2002
Publication date： Jul. 15, 2004
Summary：

【課題】計算コストの増加を抑えながら、自動的にドメインを切替えて精度よく音声認識を行なえるようにする。【解決手段】このプログラムにより実現される音声認識装置は、階層化言語モデルを用いるもので、上位層の汎用言語モデルを用いて音声認識を行なう汎用音声認識部220と、その認識結果と、下位層のトピック毎の言語モデルとの距離を算出して認識結果のトピックを検出するためのトピック検出部222と、選択されたトピックを記憶するためのトピック記憶部230と、記憶されたトピックに対応する言語モデルを用いて音声認識を行なうためのトピック別音声認識部226と、汎用音声認識部220の認識結果とトピック別音声認識部226の認識結果のうち、信頼度の高いものを選択する選択部236とを含む。【選択図】図7

Claim (excerpt)：

ツリー構造の各ノードに対応する言語モデルの集合を含む階層的言語モデルを用いた音声認識装置としてコンピュータを動作させるコンピュータプログラムであって、前記音声認識装置は、前記ツリー構造のルートノードに対応する言語モデルを用いて入力に対する音声認識を行ない、音声認識の信頼度とともに認識結果を出力するための第1の音声認識手段と、前記第1の音声認識手段の出力する認識結果と、前記階層的言語モデル中の前記ツリー構造の葉ノードの各々との間で計算される所定の指標に基づき、前記階層的言語モデル中の前記ツリー構造の葉ノードの内のいずれかを選択するための第1のノード選択手段と、前記第1のノード選択手段により選択された葉ノードを特定する情報を記憶するための記憶手段と、前記記憶手段に記憶された情報により特定される葉ノードに対応する言語モデルを用いて入力に対する音声認識を行ない、音声認識の信頼度とともに認識結果を出力するための第2の音声認識手段と、前記第1の音声認識手段から与えられる信頼度と、前記第2の音声認識手段から与えられる信頼度とに基づいて、前記第1の音声認識手段の音声認識結果と前記第2の音声認識手段による音声認識結果とのうち、より高い信頼度に対応するものを選択するための手段とを含む、コンピュータプログラム。

IPC (3)：

G10L15/18 , G10L15/06 , G10L15/28

FI (4)：

G10L3/00 537F , G10L3/00 521W , G10L3/00 571C , G10L3/00 537D

F-Term (4)：

5D015HH00 , 5D015HH11 , 5D015LL02 , 5D015LL09

Patent cited by the Patent：

Cited by examiner (4)

統計的言語モデル生成装置及び音声認識装置
Gazette classification：公開公報 Application number：特願平10-243024 Applicant：株式会社エイ・ティ・アール音声翻訳通信研究所
言語モデル生成装置及びこれを用いた音声認識装置、言語モデル生成方法及びこれを用いた音声認識方法、並びに言語モデル生成プログラムを記録したコンピュータ読み取り可能な記録媒体及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
Gazette classification：公開公報 Application number：特願2000-280655 Applicant：三菱電機株式会社
音声認識装置および音声認識方法
Gazette classification：公開公報 Application number：特願平8-214587 Applicant：ソニー株式会社

Show all

Return to Previous Page