抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
深層学習(DL)は画像,音声,言語など異なる研究領域で扱われていたモダリティーをほぼ同様の枠組みで扱えるので,マルチモーダル情報の統合に応用できる。本論文では,マルチモーダルシステムであるロボットへのDLの応用研究と将来展望を述べた。まず,DLは高い入力次元を扱えるので,状態と有限数の行動パターンの組合せからなるQ値を強化学習させるDeep Q-Learningによって環境認識,及びその状態評価を高性能に行えることを示した。次に,多自由度関節の連続時系列データである実世界におけるロボットの動作出力をDLに直接学習させる方法論“End to End Learning”について述べた。画像,音響信号,モータの各モダリティを複数のDA(Deep Autoencoder)によって統合学習することで,認識とカップリングしたロボットの動作表現を自己組織化できることを示した。また,対象とする2種類の文章をRNN(Recurrent Neural Network)における連続した系列として学習させる“Sequence to Sequence Learning”をロボットのマルチモーダル学習に応用したところ,多義的な言語入力に対して適切に解析を行って動作を生成できることがわかった。