抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,多くのマルチメディア・コンテンツの所有が可能となってきた。大量のコンテンツの中から欲しい情報を得るためには,検索のためのメタ情報を付与しておく必要がある。本研究では,マルチメディア・コンテンツの一例としてスポーツ実況中継,特に野球実況中継に注目し,実況中継音声から音声認識を用いてメタ情報を抽出することを目的としている。野球のメタ情報としては,今何が起こっているかを表すイベントと,その積み重ねである状況が存在すると考えられる。まず,現実にイベントや状況が存在し,これを基にアナウンサーは実況を行う。本研究では,実況音声から単語列だけを推定する音声認識を拡張し,実況音声から単語列・イベント系列・状況系列全てを同時に推定する音声認識手法を提案する。定式化により,イベント依存音響モデル,状況遷移モデル,イベント推定モデル,状況依存言語モデルを得る。これらを確率の枠組みで統合的に用いることで,単語列とメタ情報の同時推定を行う。実験により,イベント検出F値0.87,イベント正解率0.86,状況正解率0.77を得た。(著者抄録)