データ欠損を含むソフトウェア開発実績データのMAR欠損メカニズムの特定

Description

ソフトウェア開発において,プロジェクトを成功に導くために様々な定量的管理が行われる.定量的管理に用いられるソフトウェア開発実績データにはデータ欠損が含まれていることが多く,開発実績データに含まれるデータ欠損は,定量的管理手法の精度低下の要因となる.また,データ欠損が含まれると適用できない定量的管理手法がある.そのため,データ欠損を取り除く処理である欠損値処理が行われるが,既存の欠損値処理は欠損メカニズムに関わらず全てのデータ欠損に適用される.そこで,我々は欠損メカニズムに応じた欠損値処理の開発を目標としている.しかし,実際のデータに含まれるデータ欠損について欠損メカニズムを特定する方法はランダムなデータ欠損以外は提案されていない.そこで,本論文では,その準備として,開発実績データに含まれるデータ欠損,特に MAR 欠損メカニズムを特定する手法を提案する.提案手法では,データ欠損を含む開発データにおいて,データをいくつかに分割し,元のデータのデータ欠損数とデータ欠損を補完したデータの平均値のスピアマンの順位相関係数をとる.データ欠損を含まない開発実績データにデータ欠損を与えたデータセットを用いた評価実験の結果,F 値で 0.8 程度の精度で特定することができた.

Journal

Details 詳細情報について

Report a problem

Back to top