英単語に対する日本語読み付与方法の検討
書誌事項
- タイトル別名
-
- A study to convert English words into Japanese phonetic symbols
この論文をさがす
説明
テキストからの音声合成システムにおいて,アルファベットで書かれた未知の外来語を,日本語らしく読むことが望まれている.手始めとして,外来語の中でも最も多く使われる英単語について,日本語読みを付与する方法を検討する.現代英語の表記は,中世英語の発音が元になっている.その後,発音が変化したり,方言が混ざったりして,現代では不整合が起きているものの,英語表記から英語の音声記号への変換は,多くの単語については規則的であり,多くの研究がなされている.英語を日本語読みする場合も,原語の発音が元になっていることから,これまで研究されてきた規則を用いて,一度英語の音声記号に変換し,さらにそれを日本語の音声記号に変換する方法が考えられる.しかし,この方法にはいくつか問題もある.一つは,本来の発音より表記に由来する読み方が存在することである.たとえば,"iron"/aiern/は,「アイアン」とも読むが,「アイロン」と読んだりする.他にも,"delicate"/delikit/は,「デリキット」ではなく,「デリケート」と発音される.もう一つは,母音/e/の問題である.本来の英語では,ストレスのない母音は/e/として発音されやすいが,日本語では表記に対応した母音が用いられる.たとえば,"animal"/aenemel/,"personality"/pe:rsenaeleti/は,それぞれ「アニマル」「パーソナリティー」と発音される.この様な問題に対処するために,本研究では,英語の表記から直接日本語の読み(発音)に変換する方法を検討する.英語の規則に由来するものとしては,末尾-e規則といくつかの接尾辞規則を導入する.さらに,アルファベット部分列と日本語音節の対応規則,および,日本語特有の規則として促音規則を導入する.この結果,ほとんど音節間の関係を考慮していないにも関わらず,モーラあたり9割以上(closed data)の高い精度で,読み付与が可能となった.
収録刊行物
-
- 全国大会講演論文集
-
全国大会講演論文集 第53回 (人工知能と認知科学), 359-360, 1996-09-04
情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1050574047127957760
-
- NII書誌ID
- AN00349328
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB