Building Multi-Label Bug Prediction Models for Bug Topics

Bibliographic Information

Other Title
  • トピックを識別したバグ予測モデルの構築

Description

バグ予測は,テストやレビューの工数を効率よく集中させることができると期待されている.しかし,実際のソフトウェア開発におけるバグ予測適用の難しさの一つとして,予測結果のあいまいさが指摘されている.「バグを含む可能性が高い」という予測結果は,どのような観点のテストを用意すべきかが不明であり,バグ発見までには手間がかかる.この問題に対して,全てのバグを予測するのではなく,脆弱性や影響が大きいと考えられるバグに限定した予測モデルが提案されている.こうした詳細なバグ予測は,バグを細分化することにより予測対象バグの出現する割合が小さくなるため,予測精度が悪くなるという問題がある.具体的には,特にPrecision を高くすることが難しくなる.本稿では,構造方程式モデリングで変数間の関係を検討し,ベイジアンネットワークで予測モデルを構築することで,(1)Precision の高い予測結果を得ることができ,また,(2) 高い予測精度が出ないときも問題点を議論できるようになった.

Bug prediction has been considered bene cial since developers and managers can concentrate their quality assurance efforts on bug-prone entities. However, such prediction of future bugs do not offer the details, and such vagueness is one of the major causes of limited adoption of bug prediction in practice. With the limited resource of costs and times, investigating all bug-prone entities is not practical. Taking such practical issue into account, some speci c bug prediction models have been proposed. The models focuses on software vulnerabilities, breakage bugs, and bugs in rarely changed entities. The problems of such detailed bug prediction studies exist in the accuracy of prediction results. Since the ratios of targeted bugs are small, obtaining high accuracies become difficult. Achieving high precision is especially difficult. We built bug topic prediction models with Bayesian networks based on the structures obtained from structural equation analysis (SEM). The results show that (i) we can achieve high precision in some cases, and (ii) when we cannot achieve good prediction accuracy, we can discuss the problems.

Journal

Details 詳細情報について

Report a problem

Back to top