高速音声検索のための方法、プログラムおよび装置

発明者：
出願人/特許権者：
代理人 (1件)：龍華明裕
公報種別：特許公報
出願番号（国際出願番号）：特願2012-000070
公開番号（公開出願番号）：特開2012-133371
特許番号：特許第5210440号
出願日： 2012年01月04日
公開日（公表日）： 2012年07月12日
請求項（抜粋）：

【請求項1】マルチプロセッサシステムにおいて音声データベースを検索してターゲット音声クリップを特定する方法であって、前記音声データベースを複数のグループに分割する段階と、前記ターゲット音声クリップについてモデルを構築する段階と、前記マルチプロセッサシステムの複数のプロセッサに対して前記複数のグループを動的にスケジューリングする段階と、前記ターゲット音声クリップを検索するために、前記複数のプロセッサを用いて前記スケジューリングされた複数のグループを並列に処理する段階とを備え、前記スケジューリングされた複数のグループを並列に処理する段階は、前記スケジューリングされた複数のグループのそれぞれを複数のセグメントに分割する段階と、前記ターゲット音声クリップに含まれる最初の一部のフレームに対して仮モデルを構築し、少なくとも1つの前記セグメントに含まれる最初の一部のフレームに対して仮モデルを構築し、構築した両方の前記仮モデルの仮類似性測度を求める段階と、前記仮類似性測度が両方の前記仮モデルが類似することを示す場合、各前記セグメントについてモデルを構築し、前記ターゲット音声クリップの前記モデルと各前記セグメントの前記モデルとの類似性測度を求め、前記類似性測度に基づいて、前記セグメントは前記ターゲット音声クリップと一致すると決定する段階と、前記類似性測度に基づいて、直後の前記セグメントの処理を省略する段階と、を有する方法。

IPC (4件)：

G06F 17/30 ( 200 6.01) , G10L 25/54 ( 201 3.01) , G10L 15/06 ( 201 3.01) , G10L 15/32 ( 201 3.01)

FI (5件)：

G06F 17/30 170 E , G06F 17/30 350 C , G10L 11/00 402 B , G10L 15/06 400 V , G10L 15/28 220 Z

引用特許：

出願人引用 (8件)

高速信号探索方法、装置およびその記録媒体
公報種別：公開公報出願番号：特願平11-130630 出願人：日本電信電話株式会社
情報処理方法及び情報処理装置
公報種別：公開公報出願番号：特願2003-381637 出願人：キヤノン株式会社
連続メディアデータ格納方法および連続メディアデータ並列処理方法
公報種別：公開公報出願番号：特願2001-380462 出願人：三菱電機株式会社

全件表示

審査官引用 (10件)

高速信号探索方法、装置およびその記録媒体
公報種別：公開公報出願番号：特願平11-130630 出願人：日本電信電話株式会社
情報処理方法及び情報処理装置
公報種別：公開公報出願番号：特願2003-381637 出願人：キヤノン株式会社
連続メディアデータ格納方法および連続メディアデータ並列処理方法
公報種別：公開公報出願番号：特願2001-380462 出願人：三菱電機株式会社

全件表示

前のページに戻る