特許
J-GLOBAL ID:200903012465674010

特定分野辞書を利用した音声認識誤り訂正システム

発明者:
出願人/特許権者:
代理人 (1件): 大津 洋夫
公報種別:公開公報
出願番号(国際出願番号):特願2003-053540
公開番号(公開出願番号):特開2004-264464
出願日: 2003年02月28日
公開日(公表日): 2004年09月24日
要約:
【課題】音声認識結果に対して誤り訂正を行う場合、解析に必要となる単語を保持する辞書を必要とするが、1つの辞書に多くの特定分野にしか出てこない単語を登録すると単語数が増加するという課題がある。また、特定分野にしか出てこない単語を別の特定分野辞書として構築した場合、特定分野辞書を利用するか否かは人手で制御せねばならない煩わしさを伴うと共に、話題が頻繁に変わる対話文などの音声データに対して、誤り訂正を行うことは困難であった。【解決手段】本発明では、入力された音声データの認識結果から文章の話題を自動的に抽出すると共に、抽出した話題より当該分野の特定分野辞書を用いて解析するか否かの制御を自動的に行うことにより、どのような文章に対しても誤り訂正の精度を向上させる。【選択図】 図1
請求項(抜粋):
音声データを入力とし、コンピュータで取り扱うことのできる文字コードの列に変換するとき、その認識結果である自然言語文を、各々の文字毎の認識正解率と、各々の文字毎の認識正解率順に複数の候補を出力することを特徴とする音声認識手段と、 基本的な単語を知識として単語の表記と解析に必要な文法情報を保持する基本辞書と、話題となる分野を定義しその各々の分野に特化した単語の表記と解析に必要な単語の文法情報を保持する複数の特定分野辞書群とを有することを特徴とする、誤り訂正辞書と、 前記誤り訂正辞書中の基本辞書に登録されている単語において、表記情報と解析に必要な文法情報を登録するだけでなく、話題となる分野と関連する単語においては加えて話題認知ポイントを登録することを特徴とする基本辞書と、 前記音声認識手段の認識結果である自然言語文を解析するにおいて、前記誤り訂正辞書を用いて解析対象となる自然言語文の文法的な解析を進める際に十分な解析成功率が得られなかった場合は、前記音声認識手段が出力した各々の文字毎の認識正解率の低いものから順に文字置き換えを行いつつ、解析を進めることを特徴とする自然言語文解析手段と、 前記自然言語文解析手段を用いて解析するにおいて、前記基本辞書を用いて解析対象となる自然言語文の文法的な解析を進めるときに、前記基本辞書に登録された話題認知ポイントを用いて解析対象となる自然言語文の話題抽出処理を実行することを特徴とする自然言語文の話題抽出手段と、 前記話題抽出手段が抽出した話題の情報より前記特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析することにより、誤り訂正候補の中から選定して訂正する誤り訂正手段とを備え、 前記音声認識手段の認識結果である自然言語文中の誤り訂正処理を実施するに際して前記自然言語文解析手段を用いて自然言語文の文法的な解析と自然言語文の話題抽出をし、その抽出した話題の情報より前記特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析して、訂正手段により誤り訂正候補の中から選定して誤り訂正することにより、誤り訂正の精度を向上させるようにしたことを特徴とする特定分野辞書を利用した音声認識誤り訂正システム。
IPC (3件):
G10L15/22 ,  G10L15/06 ,  G10L15/18
FI (4件):
G10L3/00 561E ,  G10L3/00 521V ,  G10L3/00 521T ,  G10L3/00 537Z
Fターム (2件):
5D015GG03 ,  5D015LL04
引用特許:
審査官引用 (2件)

前のページに戻る