情報検索技術と深層学習を用いたコード片類似性判定法の比較調査

DOI HANDLE オープンアクセス

書誌事項

タイトル別名
  • Comparing Code Similarity Using Information Retrieval Techniques and Deep Learning

抄録

コード片の類似性判定法はソフトウェア工学における重要な基礎技術であり,コードクローン検出やコード片検索などで使用される.コード片の類似性判定法では,構文的な類似性だけでなく,処理内容の意味的な類似性も判定することが重要である.我々の先行研究では,情報検索技術に基づくベクトル表現とコサイン類似度を組み合わせた類似性判定法を用いていた.この手法は処理内容の意味的な類似性を高速に判定できる一方で,検出漏れが多い課題がある.また近年,深層学習を用いた類似性判定法が提案されている.この手法は意味的な類似性を高い精度で判定できる反面,実行速度が遅い課題がある.そこで本研究では,判定精度と実行速度の二つの観点で情報検索技術に基づくベクトル表現と深層学習の効果的な組み合わせを調査する.調査の結果,情報検索技術の一種であるLSI (Latent Semantic Indexing)と深層学習モデルの組み合わせが判定精度の面で最も高い値となった.またこの組み合わせは実行速度が最も速いことも確認した.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

  • CRID
    1390858529773389440
  • DOI
    10.14923/transinfj.2022pdp0009
  • ISSN
    18810225
    18804535
  • HANDLE
    11094/93106
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • IRDB
    • KAKEN
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ