『古今集遠鏡』コーパスの設計・構築

書誌事項

タイトル別名
  • Design and Construction of the Kokinshu -Towokagami Curpus

抄録

『古今集遠鏡』 は,本居宣長 による『古今和歌集』の注釈書である .本書の特徴は,平安時代の文語,江戸時代後期の文語,同時代の口語 の複数の文体が混在している 点にある .本書のコーパス構築にあたり ,XMLによる構造化の際には quotation タグの type属性によって分類することで ,文体の区別を示した .また,『日本語歴史コーパス』 への収録に向けた 形態素解析の際には ,それぞれの文体によって UniDicを分けて 利用し,XMLの文書構造タグによって複数の辞書を切り替えて MeCabによる解析を行 った.このように構築 されたコーパスを活用し ,本書におけるム ,テム,ナムの俚言訳の方針を 調査した結果,宣長の他の資料では得ることができなかった助動詞の解釈の相違点を見ることができた .また,本コーパスは ,同時代の『洒落本コーパス』の収録作品との比較による江戸時代後期の口語の検討や ,平安時代語と近世語の比較といった活用が考えられ ,日本語史研究の多様化が期待できる .

Kokinshu -Towokagami is the commentary on the Kokin -Wakashu written by Motoori Norinaga . The distinguishing feature of Kokinshu -Towokagami is the fact that in it, it includes multiple writing styles: literary language of the Heian -period, literary language of late Edo -period, and colloquial language of Edo -period. These different writing styles are differentiated by being categorized by the quotation tag type attributes when structured by XML. In addition, when performing morphological analysis for the implementation on CHJ corpus, switch between these multiple dictionaries is accomplished th rough the use of XML text structure tags. Using this corpus, a survey of the colloquial translations mu, temu , and namu that appear in the text was conducted. This allowed us to see differences in the interpretation of auxiliary verbs that were unavailable in other texts by Norinaga. Furthermore, use of the Kokinshu -Towokagami corpus in examination of late Edo -period verna cular through comparison with works included in the contemporary Sharebon corpus as well as use in comparisons with Heian period and earl y modern language is possible. Thus, it is anticipated that this work will contribute to the further diversification of research into the history of the Japanese language.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ