抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
我々は,エクサスケール計算機環境において耐障害性を有した階層型タスク並列アプリケーションプログラムの開発を支援するFalanxミドルウェアを開発している。Falanxは,データストア機構と資源管理機構からなり,アプリケーションプログラムを単一MPIジョブとして実行させるとともに,実行障害発生時には選択的にタスクを再実行/破棄させることができる。しかしながら,Falanxの既存実装では資源管理機構をMPIプロセスの1ランクで処理しているため,耐障害性およびスケーラビリティに課題が残っている。本稿では,Falanxシステムの耐障害性およびスケーラビリティを高めることを目指し,既発表研究で提案した高可用分散協調スケジューラをZooKeeperを用いてFalanxミドルウェアに実装した。予備実験を行った結果,細粒度のタスクを大量に処理する場合には高可用分散協調スケジューラのオーバヘッドが非常に大きくなることが分かり,タスク取得処理の効率化が必要不可欠であることが示された。(著者抄録)