DPマッチングを用いた地名の類似性と時間変化に関する研究

  • 中山 大地
    首都大学東京 都市環境科学研究科
  • 土屋 ひろの
    首都大学東京 都市環境科学研究科 首都大学東京 都市環境学部 地理環境コース 学生

書誌事項

タイトル別名
  • A study on placename similarity and temporal variation using DP matching algorithm

説明

I. はじめに<br>地名はその場所の歴史的経緯の結果であり,地名が変化することは場所に対する認識が変化することを表していると考えられる.本研究では地名の時間的・空間的変化を定量的に求めることを目的とし,地名の類似性に着目して分析を行った.文字で表現された地名を考えた場合,漢字の異字・同音異字への置き換えや発音の転訛により,本来は同一である地名が揺らぎを持つことがある.このような揺らぎを持つ対象の類似性を求めるため,本研究では地名の発音に対してDPマッチングを用いて地名の類似性を求めた.DPマッチングとは,音声・画像認識やDNA解析等によく用いられ,揺らぎのある対象間の類似性を効率よく数値化できるアルゴリズムである.<br><br>II. 研究手法<br> 1/50,000地形図「菊池(隈府)」(熊本県)の範囲を対象地域とし,旧版地形図を含む1902年,1929年,1946年,1957年,1967年,1980年の6枚を用いた.大判スキャナを用いてこれらの地形図をデジタルデータ化し,座標(日本測地系・公共測量座標系)を付与した.次に地形図上に表記されている全ての地名についてデジタイズし,6枚の地形図に表記されている居住地域名のみ(1858地名)を抽出した.これらの居住地域名の発音を日本式ローマ字に変換し,DPマッチングを用いて二つの地名間の類似性(不一致度)を求めた.このとき,文字不一致のペナルティを50,1文字ずれのペナルティを1とした.これにより求まった不一致度を計算に用いた地名のローマ字の総数で除し,2地名間の距離として定義し,全ての地名間の距離行列(1858×1858の正方行列)を作成した.<br> この距離行列に対して,統計ソフトRを用いてWARD法によるクラスター分析を行った.得られたデンドログラムを距離150と300で切り,それぞれ73個と28個のクラスターを得た.これにより,同一クラスターには地名の発音(ローマ字表記)が似ている地名が分類されたことになる.<br> 次に6時期分の地形図上に居住地域名のクラスター番号を加え,それぞれの地名クラスターが表している範囲を求めるためにボロノイ分割を行った.6時期分のボロノイ図に対して空間的な論理和を取り,生成された全てのポリゴンについてクラスター番号の変化回数,すなわち地名の変化回数について求めた.最後に地名の変化回数に対して空間的自己相関(ローカル・モラン統計量)を計算し,地名の時間変化の空間的特徴を求めた.<br><br>III. 結果<br> クラスター数を73個に設定した場合の結果を述べる.地名の変化回数は最多で5であり,最少で0だった.対象範囲の北東部は阿蘇山の外輪山にあたるために居住地名の数自体が少なく,変化もほとんど見られなかった.これらの場所は,ローカル・モラン統計量でも地形の変化回数が有意に少ない場所として求められた.これに対して外輪山の西側では新たな地名が出現していた.これは森林が桑畑になり,それが住宅地として開発されたことに伴う現象と考えられる.このような場所はローカル・モラン統計量では有意に地名の変化回数が高い場所になっていた.鉄道や駅の建設により地名変化が生じると考えていたが,この地域は元々の集落や街道に沿って鉄道を建設する形であったため,これらの影響はほとんど見られなかった.

収録刊行物

被引用文献 (1)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1390282680671579008
  • NII論文ID
    130005473675
  • DOI
    10.14866/ajg.2014s.0_100043
  • データソース種別
    • JaLC
    • CiNii Articles
    • Crossref
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ