中古和文資料『夜の寝覚』のコーパス構築の試み

書誌事項

タイトル別名
  • An Attempt to Build a Corpus of Courtly Literary Works in Early Middle Japanese Language : Yoru no Nezame

説明

本稿は中古和文資料『夜の寝覚』を対象とし、そのコーパスを構築する試みについて作業の手順と現在の進捗状況とを報告した上で今後の展望を述べるものである。まず、本稿では資料として取り上げる『夜の寝覚』の概要を説明し、この資料を対象としてコーパスを構築するための手順を提示した。次に作業を終えた約 2.3 万語のデータに基づき、コーパス全体の総語数を推計すると約 11 万語となることやそれを正解データとすると現行の「中古和文UniDic」による解析精度が約 98%となることを報告した。また、この正解データに現れた未登録語(未知語)についても併せて一覧として示した。最後に「動詞+テ+動詞」を取り上げ、このようなコーパスを構築することによって容易になる調査の事例を紹介した。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ