- 【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
- Trial version of CiNii Research Knowledge Graph Search feature is available on CiNii Labs
- Suspension and deletion of data provided by Nikkei BP
- Regarding the recording of “Research Data” and “Evidence Data”
Preliminary analyses of the full text produced by “Minna de Honkoku”
Bibliographic Information
- Other Title
-
- 「みんなで翻刻」による翻刻テキストの分析の試み
Description
市民参加型の史料翻刻プロジェクト「みんなで翻刻」で生成されたテキストに対して,既存の計量テキスト分析用のツールを利用して,頻出語の計数や共起関係の分析を実施した.また,歴史地名データを利用して,テキスト中の地名の同定についても検討した.「地震」という語には,方角や地名に関する語だけでなく,被害に関する語が伴なうことが多いことがわかった.一定の分析結果が得られたものの,分析に利用する辞書の整備や地名の同定方法を洗錬されたものにすることが今後の課題である.
We made preliminary analyses of the full text produced by “Minna de Honkoku” which is a project for crowdsourced transcription of Japanese documents on historical earthquakes. We used existing tools for text mining and dictionary to extract frequent words and co-occurrence network. We also tried to extract ace names using an integrated historical gazetteer. The word “earthquake” co-occur with the words that describes direction and place as well as damage. We need good dictionary and gazetteer to obtain better results of text mining.
Journal
-
- じんもんこん2018論文集
-
じんもんこん2018論文集 2018 147-152, 2018-11-24
情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050855522099941248
-
- NII Article ID
- 170000178728
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles