Designing Universal Dependencies for Classical Chinese and Its Application

DOI IPSJ HANDLE Open Access

Bibliographic Information

Other Title
  • 古典中国語(漢文)Universal Dependenciesとその応用

Search this article

Abstract

Universal Dependenciesに基づいて,『孟子』『論語』『禮記』『十八史略』の依存構造(係り受け)コーパスを製作した.さらに,このコーパスを用いて,古典中国語の文切り・形態素解析・係り受け解析を統合的に行う解析システムも開発した.Universal Dependenciesは,書写言語における品詞・形態素属性・依存構造(係り受け情報)を,言語に依存せず記述する手法である.Universal Dependenciesの係り受け記述は,いわゆる動詞中心主義であり,言語横断的であると同時に,古典中国語における動賓終構造の記述にも適している.ただし,Universal Dependenciesにおけるコピュラ文の記述方法は,古典中国語のコピュラ文との間で微妙に齟齬があり,結果として,補語が節であるようなコピュラ文(約1.6%)に関しては,記述は行えるものの記法上の問題が残った.

We have developed a Classical Chinese Corpus of the whole texts of “孟子”, “論語”, “禮記”, and “十八史略”, using Universal Dependencies (UD). Utilizing our Classical Chinese Corpus, we have also developed syntax analyzers, which perform sentence segmentation, word tokenization, part-of-speech tagging, and dependency parsing of Classical Chinese texts. UD is very suitable to annotate the predicate-object-final structure of Classical Chinese. But, particularly in a copula sentence whose predicate consists of a clause, the guideline of UD is insufficient for annotating Classical Chinese texts, thus we need several extensions of UD.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top