抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
機械と深い学習に沿った人工知能技術の上昇は,ほとんど制限されない可能性を開いている。近年,機械学習と深い学習における応用に基づく研究者は,多くの実用的問題のために開発中の解決策を始めた。手書き認識はそのような関心領域の一つである。世界における7番目に多い言語であるバンラは例外ではない。しかしながら,英語とは異なり,文献で報告されている異なるアプローチを比較するベンチマークを構築する協調形式的試みは,主に,形式的な比較研究なしで,開放的で自由に利用可能なデータセットの欠如とアプローチの多様性のために行われていない。本論文では,このギャップを修正することを試みた。著者らは,Ekush,NumtaDB,CMARTdb,およびBDRWを含むすべての公開可能なバンラ手書き数字データセットに関して,5つのロバストアルゴリズム,すなわちk最近傍(KNN),サポートベクトルマシン(SVM),ランダムフォレスト(RF),多層パーセプトロン(MLP),畳込みニューラルネットワーク(CNN)に焦点を合わせた。NumtaDB自体は5つの手書きデータセットの収集である。これらのアルゴリズムの最良の可能なハイパーパラメータを見出すことにより,これらのアルゴリズムを微調整することに取り組んだ。この分野で報告されている新しいアルゴリズムを試験し検証するための標準を設定し,これらの2年毎に繰り返すことを計画するオープンで検証可能なベンチマーキングプロセスの最初のポイントとして,Sankhyaが研究することを希望する。さらに,これらのアルゴリズムの最新の研究と著者らのバージョンの他の状態との著者らの研究を広範囲に比較し,これらのデータセットに関するすべての報告された結果を実行している。使用したすべてのデータセットをオープンソースとした。さらに,公共GitHubで利用可能なこれらのデータセットのcsvバージョンを作成した。すべてのモデルの中で,Sankhya CNNモデルはこれらのすべてのデータセットに対して最良の性能を示し,特にBangla文字認識のために微調整した。このCNNモデルを公共GitHubで利用できるようにした。Copyright 2020 The Institute of Electrical and Electronics Engineers, Inc. All rights reserved. Translated from English into Japanese by JST.【JST・京大機械翻訳】