{{ $t("message.ADVERTISEMENT") }}
{{ $t("message.AD_EXPIRE_DATE") }}2024年03月
文献
J-GLOBAL ID:201202222718907330   整理番号:12A1313331

音声区間自動検出技術を用いた変速再生方式による映像の高速鑑賞システムの検討

Discussion on a System for Watching Videos at Very High Speed using Two-level Fast-forwarding based on Automatic Speech Detection
著者 (4件):
資料名:
巻: 2012  号:ページ: ROMBUNNO.HCI-149,NO.13  発行年: 2012年08月15日 
JST資料番号: Z0031C  ISSN: 2186-2583  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: 日本 (JPN)  言語: 日本語 (JA)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本論文では,多くの映画のように会話やナレーションが主体として構成されている映像に広く適用可能な高速鑑賞システムを提案する。具体的には「音声箇所は聴取理解可能な速度で再生し,非音声箇所はさらに高速な速度で再生する」という変速再生方式を採用し,その前処理として必要な,対象映像中の音声区間と非音声区間の分離を自動化する認識器を構築する。市販の字幕付き映画DVDのデータセットを用いて,字幕表示区間は音声区間とみなし,MFCCを特徴量としたGaussian Mixture Modelによる機械学習を行うことにより,実用的な性能を実現した。さらに映像の高速鑑賞をPCやスマートフォンなどの多様なデバイスから行えるよう,Pogoplugを用いたクラウドベースのシステムとして実装した。(著者抄録)
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
人間機械系  ,  パターン認識  ,  その他の情報処理  ,  人工知能 
タイトルに関連する用語 (4件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る