Pat
J-GLOBAL ID:200903018549014307

同形パターン検出システム

Inventor:
Applicant, Patent owner:
Agent (1): 加古 進
Gazette classification:公開公報
Application number (International application number):2001214037
Publication number (International publication number):2003029978
Application date: Jul. 13, 2001
Publication date: Jan. 31, 2003
Summary:
【要約】【課題】プログラムのソースコード等の様々な一次元配列テキストから、簡単な処理で同形パターンを抽出する。【解決手段】本発明の同形検出アルゴリズムは、対象テキストに対して、?@字句解析(トークンの列に切る)(S110)、?A変形ルールを適用しトークン列を変形(S120)、?Bパラメータ変換(S130)後、?Cマッチングで同形クローンを検出(S140)、?D上記と逆の変形処理を行い、そのクローンの位置(ファイルまたは行)を出力する(S150)。これにより、対象テキストの同形(クローン)を検出することができる。
Claim (excerpt):
固定字句と自由字句とを含む対象テキストから、同形パターンを検出する同形パターン検出システムであって、意味のある字句を抽出する字句解析手段と、前記字句解析手段の結果に対して、対象テキストに応じてあらかじめ定めた規則による変形を行う変形手段と、前記変形手段の結果に対して、自由字句を特定の字句に置き換えるパラメータ変換手段と、前記パラメータ変換手段の結果に対して、同形を検出する同形検出手段と、検出された同形部分を出力する同形出力手段とを備えることを特徴とする同形パターン検出システム。
IPC (3):
G06F 9/45 ,  G06F 9/44 ,  G06F 17/24 554
FI (3):
G06F 17/24 554 M ,  G06F 9/44 322 A ,  G06F 9/06 620 L
F-Term (4):
5B009QB16 ,  5B076EC02 ,  5B076EC10 ,  5B081CC11
Article cited by the Patent:
Cited by examiner (2)
  • "A Language Independent Approach for Detecting Duplicated Code"
  • "On Finding Duplication and Near-Duplication in Large Software Systems"

Return to Previous Page