オーバーフィッティングは本当に問題か?
書誌事項
- タイトル別名
-
- Is overfitting really a problem?
説明
本発表では回帰分析におけるモデルの精度およびモデルの適用範囲を議論の対象とする。一般的にはモデルのオーバーフィッティングを避けるようにしてモデルは構築される。しかしモデルがオーバーフィットした場合、もちろんそのモデルの適用範囲は狭くなるが、適用範囲内であれば精度良く予測可能なモデルといえる。今回は水溶解度データを使用してモデルの適用範囲を考慮に入れたモデルの性能の比較を行った。非線形の回帰モデルを構築する手法であるsupport vector regressionのハイパーパラメータを変化させてモデルを構築し、それぞれ予測性能を評価するとともにモデルの適用範囲を設定した。モデルの適用範囲はデータ密度に基づくものである。解析の結果、モデルのオーバーフィッティング自体が問題ではなく、オーバーフィットしたモデルでも適切にモデルの適用範囲を設定することでその範囲内であれば精度良く予測可能であることを示した。
収録刊行物
-
- ケモインフォマティクス討論会予稿集
-
ケモインフォマティクス討論会予稿集 2015 (0), 28-31, 2015
公益社団法人 日本化学会・情報化学部会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390001205736916096
-
- NII論文ID
- 130005146334
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用不可