文献
J-GLOBAL ID:202002218368456360   整理番号:20A0902597

音素認識のための深部物体検出技術に向けて【JST・京大機械翻訳】

Towards Deep Object Detection Techniques for Phoneme Recognition
著者 (5件):
資料名:
巻:ページ: 54663-54680  発行年: 2020年 
JST資料番号: W2422A  ISSN: 2169-3536  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: アメリカ合衆国 (USA)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
本研究では,英語とアラビア語のための正確な音素シーケンス認識システムを構築するための切れ刃物体検出技術の利用を検討した。最近,深い学習を用いた日常生活応用におけるオブジェクト検出のための多数の技術が提案されている。本論文では,音声処理タスクにおけるオブジェクト検出技術の利用を提案する。筆者らは,検出精度と速度の間のトレードオフに基づいて,2つの最先端のオブジェクト検出器,すなわちYoloとCenterNetを選択した。3つのシステムを用いた音素系列認識の問題に取り組んだ。すなわち,画像から音声へのドメイン転送学習システム(DTS),同じ言語内の音声コーパス間の言語内移動学習システム(IATs),異なる言語からの音声コーパス間の内部言語移動学習システム(IETS)である。英語の音素認識のために,テキサスインスツルメント/マサチューセッツ研究所(TIMIT)コーパスを用いて,提案したシステムの性能を評価した。CenterNet検出器に基づく著者らのIATは,15.89%の電話誤り率(PER)を有するTIMITの試験コアセットを用いて,最良の結果を達成した。アラビア語音素認識のために,7.58%PERによる最良性能を,CenterNetを用いて達成した。これらの結果は,音素認識タスクにおけるオブジェクト検出技術の利用の有効性を示した。さらに,本研究の知見に基づいて,音声処理タスクをオブジェクト検出タスクとして扱うことができる。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (2件):
分類
JSTが定めた文献の分類名称とコードです
パターン認識  ,  自然語処理 
タイトルに関連する用語 (3件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る