書誌事項
- タイトル別名
-
- ケンキュウ データベース ノ エイゴ ハッシン ニ オケル ニューラル キカイ ホンヤク ノ カダイ
- Kenkyū dētabēsu no Eigo hasshin ni okeru nyūraru kikai hon'yaku no kadai
- What improvements are required for neural machine translation in translating research databases from Japanese to English?
この論文をさがす
説明
type:text
研究用データベースを英語化した状態で世界に向けて発信する際に,機械翻訳の利用は人手翻訳における時間や予算といった課題解決が期待できるが,翻訳の質を確保するための情報は少ない。我々は,細胞行動データベースの記述データを2種類のニューラル機械翻訳(NMT)によって日本語から英語に翻訳し,文章,文,専門用語における翻訳精度を調べた。いずれのNMTでも翻訳された文章の質は良いことが母語話者による校閲で指摘された。一方,専門用語の不適切な選択や原文の単語情報が抜けおちる訳抜け,意味の取り違えなどの誤訳が高頻度で生じていた。これらの誤訳は,母語話者による校閲でも修正することはできなかった。本論文では,これらの解析結果からNMTを利用した生命科学型のデータベースの現状を評価する。また,NMTの技術的な発展への期待に加え,用語集との連携,翻訳し易い処理,英文の質チェックなどを含んだ翻訳前後の処理なども提案する。そして,機械翻訳による学術研究データベースの自動英訳化に向けて必要な要件を明らかすることを目指す。 Machine translation tools can perform translation tasks faster and at lower costs than manual translators. However, information on the quality of the translation in research databases is limited. Therefore, to assess the effectiveness of machine translation, the descriptive data in the Cell Behavior Database was translated from Japanese to English using two neural machine translation services. Subsequently, both the translations were reviewed by native speakers, who examined the accuracy of the translation in terms of sentences, phrases, and terminology. Consequently, the quality of English sentence translation was rated as good. However, several problems such as inappropriate terminology, missing words, and mistranslations were observed. Even the native speakers could not determine the intended meaning and correct these errors. Therefore, these problems must be overcome to ensure reliable translation, for which machine translation and designing quality control systems for translated data, such as pre-and post-translation processing, should be further improved.
研究ノート
収録刊行物
-
- 慶應義塾大学日吉紀要. 自然科学
-
慶應義塾大学日吉紀要. 自然科学 69 33-52, 2022-10
慶應義塾大学日吉紀要刊行委員会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050576037420462336
-
- NII書誌ID
- AN10079809
-
- ISSN
- 09117237
-
- NDL書誌ID
- 032507557
-
- 本文言語コード
- ja
-
- 資料種別
- departmental bulletin paper
-
- データソース種別
-
- IRDB
- NDLサーチ