潜在的ディリクレ配分法を用いた韻文解析におけるセグメントサイズについて
-
- 藤田 郁
- 大阪大学大学院言語文化研究科
書誌事項
- タイトル別名
-
- On Segment Size in Poetry Analysis Using the Latent Dirichlet Allocation Method
抄録
<p>本研究は,トピックモデルの一つである潜在的ディリクレ配分法 (latent Dirichlet allocation;LDA) を,まだ先例の少ない韻文作品へ適用する際の問題点の一つと言えるセグメントサイズの設定について議論し,LDA の韻文作品研究応用の有効性を検討することを目的としている。LDA に限らず,トピックモデリングは,デジタル人文学やテクストマイニングの分野では有望なアプローチと考えられており,散文作品研究にトピックモデルを用いる研究は近年増加しているものの,詩作品へトピックモデルを応用した研究はあまり多くない。この手法の韻文コーパスへの適用に関しては,さらなる検討と知見の蓄積が必要である。本稿では,作品の総語数が25語から2万語超まで大きくバラつきがある Alfred Tennyson の韻文作品を対象とし,特に作品総語数が 1,000 語を超えるテクストを複数の小さいセグメントサイズに分割した結果について論じ,LDAに適用可能な最小セグメントサイズを提示する。</p>
収録刊行物
-
- デジタル・ヒューマニティーズ
-
デジタル・ヒューマニティーズ 3 (1), 3-15, 2022-12-31
日本デジタル・ヒューマニティーズ学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390576118542276864
-
- ISSN
- 21897867
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
-
- 抄録ライセンスフラグ
- 使用不可