特許
J-GLOBAL ID:200903064385626979

音声認識システムの自動的再学習

発明者:
出願人/特許権者:
代理人 (1件): 恩田 博宣 (外1名)
公報種別:公表公報
出願番号(国際出願番号):特願2001-562481
公開番号(公開出願番号):特表2003-524805
出願日: 2001年02月23日
公開日(公表日): 2003年08月19日
要約:
【要約】可変重み付け及び増分再学習を用いて、電話機ベースの対話型音声認識システムを再学習させる。可変重み付けには、特定の測定データの相対的な影響を変更して、統計モデルに反映する工程が含まれる。初期セットの発話に基づいて求めた初期セットの測定データに基づき統計モデルデータを求める。新しい統計モデルデータを生成して、新しい発話から求めた新しい測定データを反映する場合、新しい測定データに重み付け係数を適用して、重み付けした新しい測定データを生成する。更に、初期セットの測定データと重み付けした新しい測定データとに基づき、新しい統計モデルデータを求める。増分再学習には、古い統計モデルデータを用いて新しい統計モデルデータを生成し、維持および処理しなければならない古い測定データの量を低減する工程が含まれる。古い統計モデルデータを更新して新しい発話の特徴と属性を反映する必要がある場合、新しい発話に対して統計モデルデータを生成する。更に、古い統計モデルデータと新しい測定データ用の統計モデルデータとを処理して、新しい統計モデルデータを生成する。
請求項(抜粋):
電話機に基づく対話型音声認識システムを自動的に再学習させる方法であって、 1セットの測定データ選択基準に基づいて古いセットの発話に対する古い測定データの一部分を選択するステップと、 前記古い測定データの一部分を読み出すステップと、 新しいセットの発話に対する新しい測定データを求めるステップと、 新しい測定データに重み付け係数を適用して、重み付けした新しい測定データを生成するステップと、 前記古い測定データの一部分と重み付けした新しい測定データを使用して、新しい統計モデルデータを生成するステップと、から成るコンピュータ実行ステップを含む方法。
IPC (3件):
G10L 15/10 ,  G10L 15/00 ,  G10L 15/06
FI (3件):
G10L 3/00 531 G ,  G10L 3/00 551 A ,  G10L 3/00 521 S
Fターム (1件):
5D015GG01
引用特許:
審査官引用 (8件)
全件表示
引用文献:
審査官引用 (6件)
全件表示

前のページに戻る