抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
2つの文字列間の非類似度や共通部分を計算する方法としてWagnerとFischerによるアルゴリズムが知られている。しかし,このアルゴリズムは,Web上の大規模なデータや,数百万塩基対の遺伝子配列等の大規模な文字列に対しては計算量が大きく適用が困難である。そこで,より高速な近似編集距離計算や類似パターン検索の要素技術の1つとして,「局所一致性」を保証した系列分割手法が使われるようになってきた。これは,乱数を使って構造の対称性を崩して分割を行うことにより,もともと指数個あつた分割候補から瞬時に1つの候補を選べるようにして,劇的な高速化を実現したものである。本稿では,この系列分割アルゴリズムの既存研究について概観し,遺伝子配列からの類似部分列の発見や,文章からの剽窃発見等の大規模な文字列への応用を目指している,高速な検索手法の開発のための展望について述べる。