文献
J-GLOBAL ID:202102274330233359   整理番号:21A0678744

長短期記憶(LSTM)を用いたYouTubeサブタイトルの文間セグメンテーション【JST・京大機械翻訳】

Inter-Sentence Segmentation of YouTube Subtitles Using Long-Short Term Memory (LSTM)
著者 (10件):
資料名:
巻:号:ページ: 1504  発行年: 2019年 
JST資料番号: U7135A  ISSN: 2076-3417  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: スイス (CHE)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
近年,音声をテキストに変換し,機械翻訳を行うためのSpeechの開発に伴い,ビデオのキャプションを他の言語に同時に翻訳する技術が開発されている。これを用いて,ビデオ共有サイトであるYouTubeは,多くの言語でキャップを提供する。現在,自動キャプションシステムは,ビデオをアップロードするとき,音声データを抽出し,テキストに変換されたサブティルファイルを提供する。この方法は,実行時間に適したサブティルを生成する。しかし,SpeechからTextまでビデオからサブティルを抽出するとき,すべての文章が期間なしで生成されるので,文章を正確に翻訳することは不可能である。生成されたサブティルは,文章ユニットよりも時間単位によって分離され,翻訳されるため,翻訳結果を全体として理解するのは非常に難しい。本論文では,テキストにテキストを分割し,英語サブティルの自動翻訳の精度を改善するために,周期マークを生成する方法を提案した。本研究では,データとしてStanford大学コースによって提供された27,826の文章サブティルを使用した。この講義ビデオは完全な文章キャプションデータを提供するので,それはサブティルを一般的なYouTube様キャプションデータに変換することにより訓練データとして使用できる。LSTM-RNN(Long-Short Term Melm Reカレントニューラルネットワーク)を用いた訓練データによるモデルを構築し,周期マークの位置を予測し,予測精度は70.84%であった。本研究は,サブティルのより正確な翻訳を有する人々を提供するであろう。さらに,英語における多数のビデオ講義のより正確な翻訳を達成することにより,オンライン教育における言語障壁がより容易に壊れることが期待される。Copyright 2021 The Author(s) All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (1件):
分類
JSTが定めた文献の分類名称とコードです
自然語処理 
引用文献 (25件):
  • Bijl, D.; Henry, H.-T. Speech to Text Conversion. U.S. Patent No. 6,173,259, 9 January 2001.
  • Manning, C.D.; Christopher, D.M.; Hinrich, S. Foundations of Statistical Natural Language Processing, 1st ed.; MIT Press: Cambridge, MA, USA, 1999.
  • Krogh, A.; Larsson, B.; von Heijne, G.; Sonnhammer, E.L. Predicting transmembrane protein topology with a hidden Markov model: Application to complete genomes. J. Mol. Biol. 2001, 305, 567-580.
  • Liao, H.; Erik, M.; Andrew, S. Large scale deep neural network acoustic modeling with semi-supervised training data for YouTube video transcription. In Proceedings of the IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2013), Olomouc, Czech Republic, 8-12 December 2013.
  • Robinson, T.; Fransen, J.; Pye, D.; Foote, J.; Renals, S. WSJCAMO: A British English speech corpus for large vocabulary continuous speech recognition. In Proceedings of the International Conference on Acoustics, Speech, and Signal Processing ICASSP-95, Detroit, MI, USA, 9-12 May 1995; Volume 1.
もっと見る
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る