LDAトピックモデルによるIPAテキスト分析の試み : アルフレッド・テニスンの韻文を用いて
書誌事項
- タイトル別名
-
- An Exploratory Investigation of IPA Texts with LDA: Using Alfred Tennyson's Poems
- LDA トピック モデル ニヨル IPA テキスト ブンセキ ノ ココロミ アルフレッド・テニスン ノ インブン ヲ モチイテ
説明
テキストマイニングとデジタルヒューマニティーズ 2021
本稿は,Latent Dirichlet Allocation(LDA) トピックモデリングが詩の韻律の分析にも応用できるかどうかを検証することを目的としている。LDAはテキストに隠された意味構造を検出する文体分析手法であり,現在では主に散文テキスト分析へ応用する研究が多い。LDAを用いた詩に関する研究は比較的少ない中で,Navarro-Colorado(2018)は,スペイン語で書かれた詩においてもLDAで韻を検出できる可能性を示唆した。しかし,英語では,綴り字と発音・音は必ずしも一致せず,また音節や音素の単位で押韻される例も数多く見受けられる。そのため,綴り字のままの英文テキストにLDAを適用することは,テキスト中の韻を検出するための最適な方法とはいえないと考えた。本研究では,英語の綴り字と音の不一致を考慮し,国際音声記号(IPA)で書かれたテキストと,IPAで書かれた語を母音と子音に分割したテキストの2種類のテキストを分析することにより,IPAテキストへのLDA適用の可能性,及びIPAテキストや音単位のテキストを分析する際の問題点を提示する。
収録刊行物
-
- 言語文化共同研究プロジェクト
-
言語文化共同研究プロジェクト 2021 15-38, 2022-03-31
大阪大学大学院言語文化研究科
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390574036160477312
-
- DOI
- 10.18910/88358
-
- HANDLE
- 11094/88358
-
- 本文言語コード
- ja
-
- 資料種別
- departmental bulletin paper
-
- データソース種別
-
- JaLC
- IRDB