抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,動画投稿サイトやアプリの利用が盛んである。動画投稿時には映像に対して適切なBGMを付けることが好ましく,BGMとなる音源を探す場合,従来だとデータベースに主観的に付けられた言語情報のようなメタ情報に頼るか,実際に何曲も曲を聞いて確認する。動画投稿者は,映像に適したBGMを自動でリストアップしてくれるシステムがあると制作効率が上がると考え,この検索システムを検討する。まず,アンケート調査用のサイトを構築した。アンケート調査によって,映像と音楽に対する印象をそれぞれを形容する言語の評価によって数値化した。このとき,映像に最適なBGMも上位5位まで選択してもらった。提案法では,動画に対する特徴量をカラーヒストグラムとオプティカルフローのヒストグラムを用いて定式化し,音楽特徴量には近年のDeep Learningの研究において,よく使用されるMFCCを用いた。これらの特徴量と言語による評価値を変換する関数を重回帰分析によって求めた。提案システムの評価として,入力動画に対して類似度の高い音楽ファイルを上位5位まで算出し,回答者の順位付けと適合しているかを確認した。また,検索システムとしての評価としてMAPとNDGCを計算した。(著者抄録)