Simulation Study for Random Partitioned Histogram

Bibliographic Information

Other Title
  • ヒストグラムのランダムな分割に基づくビン幅決定法のシミュレーション研究

Description

ヒストグラムはデータの取りうる範囲を重複しない区間(ビン)に分け,その各区間内に入るデータ数によって決まる分布の推定法である。ビンは分割点を決めることで定まり,平均積分二乗誤差基準をもとにビン幅推定の理論が構成される。等間隔ビンの推定法はScott (1979) で提案され,不等間隔のビンに関してはKogure(1987)以降,多くの提案がなされてきた。その中で,Lecoutre(1987)は,分割点をデータから等パーセンタイルで選択する手法を提案し,その漸近的性質を導出している。ヒストグラムの改良について,Scott(1985)は等間隔のビンをシフトさせながらヒストグラムを推定するAveraged Shifted Histogram(ASH)を提案した。我々は,ヒストグラムの分割点を一様乱数により決定して不等間隔のヒストグラムを推定し,これを繰り返して得られたヒストグラムの平均を推定量とするRandom Partitioned Histogram(以降,RPH)を提案する。本稿では,ヒストグラムとの比較を通じてRPHの有限サンプルにおける性質と有効性をシミュレーションにより明らかにする。数値実験では,データ数,分割数,繰り返し回数を変化させ,様々なパターンで実験を行い,推定精度にどう影響するかを調べる。  シミュレーションの結果,RPHは分布の形状とサンプル数に関わらず,ビン数と繰り返し回数の適切な選択をする限りヒストグラムと比較してISE値が減少し,分散も安定化して推定精度は改良されることが明らかになった。RPHのビン数については,ヒストグラムの最適ビン数を超えて設定した場合,より推定精度が優れていることが分かった。また,サンプル数が小さい場合には,RPH推定時の繰り返し回数を多くした方が良い推定が得られる。一方で,サンプル数が大きい場合には,繰り返し回数が少ない場合でも十分に推定精度は高い。ヒストグラムでは最適でないビン幅を選択すると平滑化不足または平滑化過多により推定精度は悪くなるが,RPHでは平滑化不足または平滑化過多であっても,多くの場合ヒストグラムよりも推定精度が改良されることが分かった。したがって,RPHはデータに依存するが,分布の形状に関わらず,適用範囲が広く有効な推定手法であることが示された。

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top