深層学習によるプロジェクトを跨いだソフトウェア不具合混入予測

書誌事項

タイトル別名
  • Cross-Project Software Defect Prediction Using Deep Learning

抄録

ソフトウェア構成管理システムのコミット履歴を用い,深層学習により不具合を予測する高精度の手法が提案されており,レビューやテスト,デバッグ等への利用が期待されている.しかしこの手法では予測対象プロジェクト自身のコミット履歴で学習するため,一定数のコミット履歴を持つプロジェクト以外では適用が難しい.今回,我々は複数のオープンソース ・ ソフトウェア (OSS) のコミット履歴を用いて学習を行い,この学習モデルを社内開発したプロプライエタリ ・ ソフトウェアのプロジェクトに適用して不具合混入予測を行った.この結果,OSS のみのコミット履歴で学習した場合でも一定の予測精度を得ることができた.これは新規プロジェクトや開始後間もないプロジェクトについても不具合混入予測ができることを示唆している.さらに,複数の OSS のコミット履歴に社内プロジェクトのコミット履歴を一部混ぜて学習させたモデルでは,混ぜないものよりも予測精度が向上することがわかった.また本研究では,深層学習の畳込みニューラルネットワークがどの領域に着目しているかを可視化する手法である Grad-CAM を応用することで,予測モデルがソースコードのどの部分を着目して不具合混入と判定したかを可視化し,着目点について考察した.この結果,着目点は複数の単語の組み合わせで決まること,着目される単語は特定のライブラリや API,キーワードであり,それぞれ不具合を起こしやすいものと,不具合を起こしやすいものではないが,不具合箇所周辺に出現しやすいものに分類できることがわかった.また,社内プロジェクトで学習したモデルによる予測では,プロジェクト固有の着目点が含まれていることが分かった.前述した複数の OSS のコミット履歴に社内プロジェクトのコミット履歴を一部混ぜて学習させたモデルによる予測精度の向上は,この着目点の追加が理由と考えられる.

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1050855522047852416
  • NII論文ID
    170000150622
  • Web Site
    http://id.nii.ac.jp/1001/00198876/
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ