テキストを音声信号と整列する方法

発明者： ,
出願人/特許権者：
代理人 (1件)：中村稔 (外6名)
公報種別：公開公報
出願番号（国際出願番号）：特願平10-242823
公開番号（公開出願番号）：特開平11-191000
出願日： 1998年08月28日
公開日（公表日）： 1999年07月13日
要約：

【要約】【課題】テキストファイルのテキストセグメントを音声ファイルの音声セグメントに整列するコンピュータ化された方法を提供する。【解決手段】コンピュータ化された方法において、テキストファイルのテキストセグメントが音声ファイルの音声セグメントと整列される。テキストファイルは、書かれたワードを含み、そして音声ファイルは、話されたワードを含む。テキストセグメントから語彙及び言語モデルが発生される。語彙及び言語モデルを用いて音声セグメントからワードリストが確認される。ワードリストは、テキストセグメントと整列され、そして対応するアンカーがワードリスト及びテキストセグメントにおいて選択される。アンカーを使用して、テキストセグメント及び音声セグメントは、アンカーに基づき非整列及び整列セグメントに区切られる。終了条件に達するまで非整列セグメントに対してこれらのステップが繰り返される。

請求項（抜粋）：

テキストファイルのテキストセグメントを音声ファイルの音声セグメントと整列するためのコンピュータ化された方法において、テキストセグメントから語彙及び言語モデルを発生し、上記語彙及び言語モデルを用いて音声セグメントからワードリストを認識し、ワードリストをテキストセグメントと整列し、ワードリスト及びテキストセグメントにおいて対応するアンカーを選択し、テキストセグメント及び音声セグメントをアンカーに基づいて非整列及び整列セグメントへと区切り、そして終了条件に到達するまで非整列セグメントで上記発生、認識、整列、選択及び区切り段階を繰り返す、という段階を備えたことを特徴とする方法。

IPC (4件)：

G10L 3/00 571 , G10L 3/00 535 , G06F 3/16 330 , G06F 17/21

FI (4件)：

G10L 3/00 571 S , G10L 3/00 535 A , G06F 3/16 330 G , G06F 15/20 568 Z

引用特許：

審査官引用 (2件)

マルチメディア公衆電話システム
公報種別：公開公報出願番号：特願平9-026218 出願人：株式会社明電舎
翻訳用コンピュータ操作方法、字句モデル生成方法、モデル生成方法、翻訳用コンピュータシステム、字句モデル生成コンピュータシステム及びモデル生成コンピュータシステム
公報種別：公開公報出願番号：特願平4-191712 出願人：インターナショナル・ビジネス・マシーンズ・コーポレイション

引用文献：

審査官引用 (1件)

Indexing and search of multimodal information

前のページに戻る