「みんなで翻刻」による翻刻テキストの分析の試み

書誌事項

タイトル別名
  • Preliminary analyses of the full text produced by “Minna de Honkoku”

説明

市民参加型の史料翻刻プロジェクト「みんなで翻刻」で生成されたテキストに対して,既存の計量テキスト分析用のツールを利用して,頻出語の計数や共起関係の分析を実施した.また,歴史地名データを利用して,テキスト中の地名の同定についても検討した.「地震」という語には,方角や地名に関する語だけでなく,被害に関する語が伴なうことが多いことがわかった.一定の分析結果が得られたものの,分析に利用する辞書の整備や地名の同定方法を洗錬されたものにすることが今後の課題である.

We made preliminary analyses of the full text produced by “Minna de Honkoku” which is a project for crowdsourced transcription of Japanese documents on historical earthquakes. We used existing tools for text mining and dictionary to extract frequent words and co-occurrence network. We also tried to extract ace names using an integrated historical gazetteer. The word “earthquake” co-occur with the words that describes direction and place as well as damage. We need good dictionary and gazetteer to obtain better results of text mining.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ