画像と地図情報を利用した建物の認識

書誌事項

タイトル別名
  • Recognition of Buildings using map and image

この論文をさがす

抄録

近年, 通信基盤や情報処理機器の発達に伴い, ナビゲーションシステムに代表されるようなリアルタイムな実世界情報を利用する技術への要求が高まっている。実世界情報を利用するシステムを構築するには, 市街地シーンの認識が必要である。本文では, 市街地シーンにおける建物を認識することによって, 市街地シーンの理解について, 検討を行う。市街地シーンにおいては, 広い範囲にわたって建物が映っている遠景のシーンでは, オブジェクトのほとんどは建物であるため, シーンを理解するためには建物を認識すればよい。一方, 地図データベースには, 実世界における建物の2次元的な位置情報を示す空間位置情報とポリコンや階数などのような幾何的な情報が存在する。そこで, 画像から得られる建物の情報と, 地図データベースに存在する情報のマッチングをとることで, 市街地シーンの認識を行う。カメラの位置と向きのパラメータがわかる場合, 投影変換を用いれば, 地図データベースにおける建物のモデルを画像に投影し, 建物を検出することが可能となるが, カメラの投影変換が完全かつ精密にわかるのであれば, 精密にオブジェクトとモデルのマッチングがとれるはずである。しかし, 現実には, 投影変換のパラメータの推定で誤差が生じるため, 投影されたオブジェクトと実際に画像に映っているオブジェクトが精密に合えない可能性が高い。そこで, オブジェクトをロバストに検出するため, 2DTM (2D Template Matching)を利用して, 建物を検出する。2DTMとは, 3次元オブジェクトのモデルから投影変換で生成されたテンプレートと探索する画像頼域のオブジェクトの部分との類似度を評価することにより, 画像中のオブジェクトと一致する箇所を求め, オブジェクトの姿勢を検出する手法である。画像から2DTMを用いて建物を検出する場合, まず, 画像からエッジを抽出する。次に, 建物のモデルを生成する。そして, カメラの投影変換を用いて建物のモデルを画像に投影する。投影されたモデルをテンプレートとして, エッジ画像におけるテンプレートの周辺のエッジとマッチングを行う。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ