大規模なソフトウェア群を対象とするメソッド単位でのコードクローン検出

書誌事項

タイトル別名
  • ダイキボ ナ ソフトウェアグン オ タイショウ ト スル メソッド タンイ デ ノ コードクローン ケンシュツ
  • Method Clone Detection for a Large Number of Software Systems

この論文をさがす

説明

ソフトウェア間にまたがるコードクローンを検出することは,多くのプロジェクトに頻出する処理のライブラリ化による開発効率の向上やライセンスに違反したソースコード流用の特定などの観点から有益である.しかし,既存の研究ではこのようなコードクローンの検出に多大な時間を必要とし,また高速に検出を行うファイル単位の検出手法でもファイルの一部がコードクローンである場合は検出できないという問題点をかかえている.本研究では,大規模なソフトウェア群からメソッド単位のコードクローンを高速に検出する手法を提案する.実験の結果,提案手法は約3億6千万行のソースコードから約4.45時間でコードクローン検出を終了し,検出したコードクローンの40%はファイル単位の手法では検出できないことが確認できた.

Detecting code clones across software systems is useful from the viewpoint that we can discover source code license violations or improve work efficiency by merging common functions into libraries. However, existing methods need much time to detect code clones from software systems and file-based code clone detection, quickly detects code clones from software systems, cannot detect partially-duplicated files. In this research, we propose a method that detects method-based code clones in a huge data set. As a result of experiments, it took about 4.45 hours to detect code clones from about 360 million lines of source code by using the proposed method. Also, we found that 40% of code clones cannot be detected by using file-based code clone detection.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ