書誌事項
- タイトル別名
-
- Comparing Code Similarity Using Information Retrieval Techniques and Deep Learning
抄録
コード片の類似性判定法はソフトウェア工学における重要な基礎技術であり,コードクローン検出やコード片検索などで使用される.コード片の類似性判定法では,構文的な類似性だけでなく,処理内容の意味的な類似性も判定することが重要である.我々の先行研究では,情報検索技術に基づくベクトル表現とコサイン類似度を組み合わせた類似性判定法を用いていた.この手法は処理内容の意味的な類似性を高速に判定できる一方で,検出漏れが多い課題がある.また近年,深層学習を用いた類似性判定法が提案されている.この手法は意味的な類似性を高い精度で判定できる反面,実行速度が遅い課題がある.そこで本研究では,判定精度と実行速度の二つの観点で情報検索技術に基づくベクトル表現と深層学習の効果的な組み合わせを調査する.調査の結果,情報検索技術の一種であるLSI (Latent Semantic Indexing)と深層学習モデルの組み合わせが判定精度の面で最も高い値となった.またこの組み合わせは実行速度が最も速いことも確認した.
収録刊行物
-
- 電子情報通信学会論文誌D 情報・システム
-
電子情報通信学会論文誌D 情報・システム J106-D (4), 231-243, 2023-04-01
The Institute of Electronics, Information and Communication Engineers
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390858529773389440
-
- ISSN
- 18810225
- 18804535
-
- HANDLE
- 11094/93106
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- IRDB
- KAKEN
-
- 抄録ライセンスフラグ
- 使用不可