書誌事項
- タイトル別名
-
- Construction of Russian Translation Data of "The Balanced Corpus of Contemporary Written Japanese"
説明
TUFS,JSPS,NINJAL
TUFS
会議名: 言語資源活用ワークショップ2018, 開催地: 国立国語研究所, 会期: 2018年9月4日-5日, 主催: 国立国語研究所 コーパス開発センター
『現代日本語書き言葉均衡コーパス』(の一部のデータ)には,既に英語,イタリア語,インドネシア語,中国語の翻訳データが構築されているが,新たにロシア語の翻訳データを構築した.対象となるテキストは『現代日本語書き言葉均衡コーパス』新聞(PN)コアデータ16サンプル(総語数は短単位で全16,657語)とし,ロシア語翻訳データの総語数は13,070語となった.本データの構築あたっては,日本語からロシア語へ人手による翻訳を行った.また,日本語と ロシア語の言語構造の違いにより,翻訳に困難を生じさせた箇所も多くあった.本稿では,翻訳データの構築方法,翻訳の際の留意点の詳細を述べる.さらに,この翻訳データの構築により,原データと並べることで疑似的な日露対訳コーパスとしての利用も可能であり,本データは日露対照研究に活用できると考えられる.本稿では,そのような活用の一例として,日本語の文末形式について,簡単にロシア語と対照させて論じる.
source:https://pj.ninjal.ac.jp/corpus_center/lrw2018.html
identifier:東京外国語大学,日本学術振興会,国立国語研究所
identifier:東京外国語大学
収録刊行物
-
- 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
-
言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop 3 2-11, 2018
国立国語研究所
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390009224768322176
-
- NII論文ID
- 120006698054
-
- Web Site
- http://id.nii.ac.jp/1328/00001633/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- JaLC
- IRDB
- CiNii Articles
- NINJAL