文献
J-GLOBAL ID:201902256870122703   整理番号:19A1135144

Berlekamp-Masseyアルゴリズムの並列simdCPUおよびGPU実装とその誤差補正応用【JST・京大機械翻訳】

Parallel SIMD CPU and GPU Implementations of Berlekamp-Massey Algorithm and Its Error Correction Application
著者 (1件):
資料名:
巻: 47  号:ページ: 137-160  発行年: 2019年 
JST資料番号: B0257B  ISSN: 0885-7458  資料種別: 逐次刊行物 (A)
記事区分: 原著論文  発行国: ドイツ (DEU)  言語: 英語 (EN)
抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
Berlekamp-Masseyアルゴリズムは二値入力系列に対する最短線形フィードバックシフトレジスタを見出す。暗号とディジタル信号処理のような広範囲の応用がこのアルゴリズムを使用する。本研究では,BMAに対して最良の可能な性能を達成するために,不均一CPUとGPUハードウェアにより提供される新しい並列メカニズムを提案した。提案したBMAアルゴリズムのビットごとの実装は,最新の実装の状態よりもほぼ35倍高速である。この更なる改良は,データレベルの並列性を提供するSIMD命令を用いることにより達成される。この新しいアプローチは,ビットワイズCPUと最先端実装の状態よりもそれぞれ4.6と35倍速い。マルチコア構造上での最高の可能な高速化を達成するために,本研究ではマルチスレッド実装を導入した。OpenMP上での活用により,12個のコアサーバ上で10倍の高速化を得ることができた。数千の処理コアを有するGPU装置は,最良のCPU実装に対して大きな高速化をもたらすことができる。GPUによって提供される他の2つのパラレルメカニズムは,同時カーネル実行とストリーミングである。それらは,CPUシリアルおよび典型的CUDA実装と比較して,それぞれ14.5および2.2倍の高速化を達成した。また,SIMD命令によるオープンMPコードの性能をGPUストリーム実装と比較した。提案した方法の有効性を実世界誤差補正応用で評価し,6.8倍の高速化を達成した。Copyright 2018 Springer Science+Business Media, LLC, part of Springer Nature Translated from English into Japanese by JST.【JST・京大機械翻訳】
シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。

準シソーラス用語:
シソーラス用語/準シソーラス用語
文献のテーマを表すキーワードです。
部分表示の続きはJDreamⅢ(有料)でご覧いただけます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
, 【Automatic Indexing@JST】
分類 (4件):
分類
JSTが定めた文献の分類名称とコードです
言語プロセッサ  ,  計算理論  ,  計算機システム開発  ,  専用演算制御装置 
タイトルに関連する用語 (5件):
タイトルに関連する用語
J-GLOBALで独自に切り出した文献タイトルの用語をもとにしたキーワードです

前のページに戻る