『現代日本語書き言葉均衡コーパス』のロシア語翻訳データの構築

書誌事項

タイトル別名
  • Construction of Russian Translation Data of "The Balanced Corpus of Contemporary Written Japanese"

説明

TUFS,JSPS,NINJAL

TUFS

会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター

『現代日本語書き言葉均衡コーパス』(の一部のデータ)には,既に英語,イタリア語,インドネシア語,中国語の翻訳データが構築されているが,新たにロシア語の翻訳データを構築した.対象となるテキストは『現代日本語書き言葉均衡コーパス』新聞(PN)コアデータ16サンプル(総語数は短単位で全16,657語)とし,ロシア語翻訳データの総語数は13,070語となった.本データの構築あたっては,日本語からロシア語へ人手による翻訳を行った.また,日本語と ロシア語の言語構造の違いにより,翻訳に困難を生じさせた箇所も多くあった.本稿では,翻訳データの構築方法,翻訳の際の留意点の詳細を述べる.さらに,この翻訳データの構築により,原データと並べることで疑似的な日露対訳コーパスとしての利用も可能であり,本データは日露対照研究に活用できると考えられる.本稿では,そのような活用の一例として,日本語の文末形式について,簡単にロシア語と対照させて論じる.

source:https://pj.ninjal.ac.jp/corpus_center/lrw2018.html

identifier:東京外国語大学,日本学術振興会,国立国語研究所

identifier:東京外国語大学

収録刊行物

参考文献 (1)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ