古典中国語(漢文)Universal Dependenciesとその応用

DOI 情報処理学会 HANDLE オープンアクセス

書誌事項

タイトル別名
  • Designing Universal Dependencies for Classical Chinese and Its Application

この論文をさがす

抄録

Universal Dependenciesに基づいて,『孟子』『論語』『禮記』『十八史略』の依存構造(係り受け)コーパスを製作した.さらに,このコーパスを用いて,古典中国語の文切り・形態素解析・係り受け解析を統合的に行う解析システムも開発した.Universal Dependenciesは,書写言語における品詞・形態素属性・依存構造(係り受け情報)を,言語に依存せず記述する手法である.Universal Dependenciesの係り受け記述は,いわゆる動詞中心主義であり,言語横断的であると同時に,古典中国語における動賓終構造の記述にも適している.ただし,Universal Dependenciesにおけるコピュラ文の記述方法は,古典中国語のコピュラ文との間で微妙に齟齬があり,結果として,補語が節であるようなコピュラ文(約1.6%)に関しては,記述は行えるものの記法上の問題が残った.

We have developed a Classical Chinese Corpus of the whole texts of “孟子”, “論語”, “禮記”, and “十八史略”, using Universal Dependencies (UD). Utilizing our Classical Chinese Corpus, we have also developed syntax analyzers, which perform sentence segmentation, word tokenization, part-of-speech tagging, and dependency parsing of Classical Chinese texts. UD is very suitable to annotate the predicate-object-final structure of Classical Chinese. But, particularly in a copula sentence whose predicate consists of a clause, the guideline of UD is insufficient for annotating Classical Chinese texts, thus we need several extensions of UD.

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ