音声・状況の同時認識に基づく野球実況中継へのメタ情報付与

佐古淳; 滝口哲也; 有木康雄

文献

J-GLOBAL ID：200902215792892688 整理番号：09A0282324

音声・状況の同時認識に基づく野球実況中継へのメタ情報付与

出版者サイト複写サービスで全文入手
高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=09A0282324&from=J-GLOBAL&jstjournalNo=L6391A") }}

著者 (3件)： , ,
資料名：
巻： 3rd ページ： 59-64 発行年： 2009年
JST資料番号： L6391A 資料種別：会議録 (C)
記事区分：原著論文発行国：日本 (JPN) 言語：日本語 (JA)

近年,多くのマルチメディア・コンテンツの所有が可能となってきた。大量のコンテンツの中から欲しい情報を得るためには,検索のためのメタ情報を付与しておく必要がある。本研究では,マルチメディア・コンテンツの一例としてスポーツ実況中継,特に野球実況中継に注目し,実況中継音声から音声認識を用いてメタ情報を抽出することを目的としている。野球のメタ情報としては,今何が起こっているかを表すイベントと,その積み重ねである状況が存在すると考えられる。まず,現実にイベントや状況が存在し,これを基にアナウンサーは実況を行う。本研究では,実況音声から単語列だけを推定する音声認識を拡張し,実況音声から単語列・イベント系列・状況系列全てを同時に推定する音声認識手法を提案する。定式化により,イベント依存音響モデル,状況遷移モデル,イベント推定モデル,状況依存言語モデルを得る。これらを確率の枠組みで統合的に用いることで,単語列とメタ情報の同時推定を行う。実験により,イベント検出F値0.87,イベント正解率0.86,状況正解率0.77を得た。(著者抄録)

, , , , , , ,
, ,

音声処理 , 情報検索一般

, , , ,

前のページに戻る