Image-based Crowd Counting with Perspective Geometry Using Smartphone

Bibliographic Information

Other Title
  • 俯瞰画像における動体領域面積に基づく群衆人数推定法の提案

Search this article

Description

本研究では,クラウドソーシングによる都市の群衆把握を目的とし,スマートフォンを有する協力者がビルの2階など比較的高所から群衆を撮影した俯瞰画像内の群衆人数を推定する手法を提案する.画像からの群衆人数推定法として,特徴量に基づき人物形状の検出を行う方式があるが,群衆内の人は身体の境界が明確に現れにくいため,高精度に特徴量を得ることは難しい.そこで本研究では,群衆が存在する画像内領域をまず推定し,その面積に基づく群衆人数推定法を提案する.提案手法では,群衆が移動していることを仮定し,短い時間間隔で撮影された2つの画像の差分をとることで群衆が存在する動体領域を抽出する.3次元空間シミュレータUnityを用いてあらかじめ構築した歩行者面積モデルを構築しておき,動体領域における1人あたりの面積を用いて高精度な群衆人数推定を実現させる.Unityで再現した群衆画像およびJR大阪駅前で撮影した画像に対してそれぞれ提案手法を適用したところ,Unityによるシミュレーションでは絶対誤差が平均13.1%となり,人がすべて動いている前提であれば実環境のJR大阪駅前では12.0%となることが確認できた.

In this research, we propose a method to estimate the number of people in crowds by using a smartphone camera. Our method uses a long shot of people crowds captured by a user above the ground level. A native approach is to count people by applying image recognition algorithms based on image features of a human. Actually, such an approach cannot achieve high accuracy because the edge of a human shape is often obscured by others in crowds. Therefore, we take a different approach using detection of moving object regions. The proposed method detects areas of moving objects by taking differences of consecutive two images captured at a short interval. We regard the detected areas as people crowds assuming that people are moving. We also build a model to estimate the occupied area size per person since it changes depending on camera height, and angle, positions in an image and moving directions due to perspective geometry. The model is constructed through 3D simulations of walking pedestrians using the 3D simulator Unity. For evaluation, we have applied the proposed method to images of people crowds simulated by on Unity and captured near JR Osaka station. The result shows that the absolute error is 13.1% in simulations and 12.0% those in the real world.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top