特許
J-GLOBAL ID:201103047352099090

テキストフォーマッティング及びスピーチ認識のためのトピック特有のモデル

発明者:
出願人/特許権者:
代理人 (3件): 伊東 忠彦 ,  大貫 進介 ,  伊東 忠重
公報種別:公開公報
出願番号(国際出願番号):特願2011-106732
公開番号(公開出願番号):特開2011-186491
出願日: 2011年05月11日
公開日(公表日): 2011年09月22日
要約:
【課題】テキスト又はスピーチ入力のコンテクスト特有の及び/又は構造的な情報を明確に使用することによってスピーチ認識及びテキストフォーマッティングの改善された方法を提供する。【解決手段】第1のスピーチ認識パスから取得されうるテキスト文書は、セグメント化されそれぞれの取得されたセクションごとにトピック特有のモデルの対応付けを施される。モデルの組の中の各モデルは、テキスト処理又はフォーマッティング規則、言語モデル蓋然性についての統計情報を提供する。更にスピーチ認識及び/又はフォーマッティングシステムの他の特性(例えば発話速度の設定)が統計モデルにおいて符号化されることができる。モデルは注釈付き訓練データに基づいて及び/又は手動のコーディングによって生成される。テキストのセクションに対するモデルの対応付けに基づき、改善されたスピーチ認識及び/又はテキストフォーマッティングプロシージャが実施される。【選択図】図2
請求項(抜粋):
トレーニングデータ及び/またはマニュアルコーディングに基づきそれぞれ生成された複数の統計モデルを用いてテキストを変更する、コンピュータで実施する方法であって、 格納した命令を実行する処理ユニットを動作させて、前記テキストを複数のセクションにセグメント化する段階と、 格納された命令を実行する処理ユニットを動作させて、前記セクションのテキストの分析に応じて、前記複数の統計モデルのうちの一統計モデルを各セクションに対応付ける段階と、 格納した命令を実行する処理ユニットを用いて、各セクションに対してテキスト変更プロシージャを実行して、そのセクションに対応付けた統計モデルの規則と語彙とを用いて、そのセクションのテキストを変更する段階とを有する、方法。
IPC (3件):
G10L 15/22 ,  G10L 15/28 ,  G10L 15/06
FI (3件):
G10L15/22 470Z ,  G10L15/28 370E ,  G10L15/06 300H
Fターム (1件):
5D015HH14
引用特許:
出願人引用 (1件)
  • 米国特許第6,052,657号明細書
審査官引用 (2件)

前のページに戻る