機能等価メソッドデータセットを利用したLLMによるコードクローン検出の精度向上

機関リポジトリ (HANDLE) オープンアクセス

書誌事項

タイトル別名
  • Improving accuracy of code clone detection by LLM using functional equivalent method dataset

説明

井上, 龍太郎, 肥後, 芳樹. 機能等価メソッドデータセットを利用したLLMによるコードクローン検出の精度向上. 電子情報通信学会技術研究報告 123(414), 162 (2024)

コードクローンとはソースコード中の一致または類似した部分を持つコード片で,バグの拡散の原因となるため,効率的な検出とリファクタリングが必要である.また,LLM(大規模言語モデル)を用いたコードクローン検出は,構文的な類似度の低いコードクローンに対してLLMを用いない既存ツールよりも高精度であるが改善の余地がある.そこで本研究では,FEMPDatasetを用いたファインチューニングによりLLMの検出精度向上を試みた.性能評価にはFEMPDatasetおよびBigCloneBenchを用いた.結果,FEMPDatasetでは精度向上が確認されたものの,BigCloneBenchでは精度の改善が見られなかった.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050583082064147456
  • ISSN
    24326380
    09135685
  • HANDLE
    11094/98116
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB

問題の指摘

ページトップへ