明治期東京におけるアドレスマッチングシステムの構築

DOI

書誌事項

タイトル別名
  • Constructing an address matching system in Tokyo in the Meiji era

抄録

1.はじめに<br>近年,GIS(地理情報システム)を用いた歴史地理学研究が活発化しており,歴史データベースの構築や旧町村界の復元など様々な研究が行われている.しかし,歴史データの整備には多大な時間と労力が必要であり,歴史地理学研究の大きな障害となっている.アドレスマッチングは住所を位置座標に変換する手法であり,この手法を用いた,東京大学空間情報科学研究センターが提供している「CSVアドレスマッチングサービス」(相良ほか 2001)は,日本国内におけるアドレスマッチングシステムを代表するものである.しかしこのシステムは,現在の住所を対象とするものであり,明治・大正期といった過去の住所に対する位置座標は取得することができない.そこで本研究では,明治期東京の住所を位置座標へと変換するアドレスマッチングシステムを構築した.<br>2.住所データベースの作成<br>住所データベースは,「東京郵便局 東京市十五區番地界入地圖 明治40年調査」(人文社編集部 1986)を用いて作成した.この地図には,明治40(1907)年時点の東京市15区内の地番や町名が記載されているほか,主要な建造物についてはその名称が記載されている.この地図をデジタルデータ化しアフィン変換による幾何補正を行った後, ArcGISを用いて住所のポリゴンデータを作成し,地図に従って町名や番地のデータを入力した.入力の際,異字体等を考慮せず可能な限り地図に用いられている文字通りに入力した.同様の作業を東京市15区すべてについて行い,東京市全域の号レベルの住所のポリゴンデータが完成した.このポリゴンデータを番地・丁目・町名・区・市の単位ごとに集約し,より階層レベルの高い住所のポリゴンデータを作成した.住所のデータは合計58,758件であった.これらの各住所データについて,市・区・町名を連結した文字列を表示する列をデータベースに新たに追加した.この列は,住所の検索の際に用いる.さらに,ArcGISのジオメトリ変換ツールを用いて,作成した各階層レベルのポリゴンデータからラベルポイント(ポリゴン内にあることを保証する点)を作成し,住所代表点としてその座標値をデータベースに追加した.東京市や各区の代表点については国立国会図書館近代デジタルコレクション(国立国会図書館 2015)より,東京交通便覧(山口 1911.請求記号:特71-782)を参照し,当時の市区役所の位置に代表点を作成した.<br>3.住所検索アルゴリズムの概要<br>本アルゴリズムでは,「東京市麹町區富士見町一丁目一番地一号」のように入力された住所の文字列を,「東京市/麹町區/富士見町/1丁目/1番地/1号」のように変換・分割したうえでデータベースから検索する. まず,入力された住所について,データベースで用いられている旧字に揃えるために,神田区の「神」を「神」に,本郷区の「郷」を「鄕」に,浅草区の「浅」を「淺」に変換するほか,各区で用いられている「区」についても旧字の「區」に変換を行う.また,本システム上の住所データは「東京市」から始まっているため,入力された住所が「東京市」から始まっていない場合は先頭に「東京市」を付加する.このように変換した入力住所について,先頭から1文字ずつ延ばしながらデータベース上の市・区・町名部分を連結した文字列に対して前方一致で検索を行う.その際に,旧字や誤字などのデータベースと異なる文字が使われている場合がある.このような場合に対応するため,本アルゴリズムではデータベースと異なる文字については一度任意の1文字に置換し,その後ろの文字から再び検索を継続する.そして,検索住所について最後まで検索するか,再び検索結果がなくなるまで検索を続ける.この流れの中で検索の結果が見つからない住所については,出力の際にその旨を示すメッセージが表示される.最終的に検索された町名までの住所文字列を検索文字列全体から除くことで,丁目以降の部分が導かれる.丁目以降の部分は「一ノ一」や「1-1」など様々な表記方法が存在する.そのため後半部分は数字をすべて半角算用数字,それ以外の数字に挟まれた文字列を「#」に置き換え,統一した表示形式に変換する.ここで導いた半角の算用数字を「#」で分割し,丁目・番地・号それぞれの列で検索を行い,該当する住所データ及び座標を取得する.<br>参考<br>国立国会図書館 2015.国立国会図書館近代デジタルコレクション.http://dl.ndl.go.jp/(最終閲覧日:2016年1月14日)<br>相良 毅・有川正俊・坂内正夫 2001.分散位置参照サービス.情報処理学会論文誌 42:2928-2940.<br>人文社編集部 1986.『東京郵便局 東京市十五區番地界入地圖 明治40年調査』人文社.<br>山口弥一 1911.『東京交通便覧』公友社.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390001205694715136
  • NII論文ID
    130007017502
  • DOI
    10.14866/ajg.2016s.0_100157
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ