抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
ドキュメント指向型データベースは,ドキュメントをスキーマレスに保存し,それに対する探索クエリを実行でき,水平分散を行えるデータベースであり,豊富な機能と拡張性を持っている。そのため,多くの文書を扱うwebアプリケーションなどで広く用いられている。ドキュメント指向型データベースの主な処理は文字列探索であり,膨大な情報を扱う場合の文字列探索の計算量は大きい。ドキュメント指向型データベースは,インデックスを用いてこれを高速化しているが,正規表現探索等インデックスを使えないクエリがボトルネックとなる。インデックスを使えないクエリを高速化するためにGPUが用いられるが,GPUのデバイスメモリの制約から,多くのドキュメントやドキュメント数の動的な変化に対する対処が困難であるという欠点がある。そこで,本論文では,動的にGPUの数を変更できるGPUクラスタ環境である分散GPUデータストアを提案する。GPUの数を動的に変化できるようにすることで,ドキュメント数に応じて必要な台数のGPUを用いることができ,ドキュメント数の変化に対処できる。GPU2台を用いて,一件あたり8文字の文字列を含むドキュメント一億件に対する正規表現探索クエリの実行時間を評価した。その結果,分散GPUストアは,GPUをホストと直接接続した場合に比べて性能低下を22%に抑え,代表的なドキュメント指向型データベースであるMongoDBに対して,最大339倍の性能向上を達成した。(著者抄録)