訓点資料の書き下し文自動生成を目的としたヲコト点を中心とする訓点の計量分析

書誌事項

タイトル別名
  • Quantitative Analysis of Kunten Materials for Interpreted Text Generation

この論文をさがす

説明

本論文では,訓点資料の書き下し文を自動生成することを目的とし,書き下し文を自動生成するうえで問題となる,1つの漢字に複数のヲコト点が付与されている場合の分析を行い,ヲコト点の読み順が定まるかを検証した.ヲコト点は記号訓点の一種で,漢字に付された位置と形状により読みは定まるが,ヲコト点が複数あった場合,順番は定まらない.たとえば「シ」,「テ」,「ニ」と3つのヲコト点がついていた場合に「ニシテ」と順を定めて書き下すためには,読み順の定義が必要である.対象とした資料(国立国語研究所蔵『尚書(古活字版)』)には121種類,のべ672個のヲコト点の組合せが登場するが,いずれも読み順が一意に定まることが確認できた.また,漢字の読み仮名の一部を表す場合のみに使われるヲコト点も抽出することができた.

This paper describes quantitative analysis of the gloss in the Kunten Materials. It aims at an automatic interpreted text generation. For a description the Kunten Materials, we developed the Iten tool and constructed a data of gloss in the “Shangshu” (old type print version). This constructed data is suitable for the quantitative analysis with computer. We analyzed the reading order of the multi wokototen marks on a character using the data. Define the reading order of wokototen marks is important to generate the interpreted text. For example, a character has 3 kinds of wokoten these shows “シ”, “テ”, “ニ”. In this case, the reading order is “ニシテ”. We need to identify the general patterns that can appear in the documents, and define the reading order for these patterns. We checked every combination pattern of the wokototen marks in this document. There are 121 combination patterns, and we fixed the order. In addition, we extract the wokototen marks that show how to read the Chinese character.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ