『リグ・ヴェーダ』の文書間類似度比較:機械学習とn-gram分析による詩人の言語使用の特定

書誌事項

タイトル別名
  • Comparing Document Similarity in the Rigveda: Identifying Language Use of Poets by Machine Learning and N-gram Analysis

この論文をさがす

抄録

本論文は,サンスクリット文献『リグ・ヴェーダ』を構成する詩節どうしの類似度を算出することで文献学的成果を検証し,詩節創作者の詩人らの言語使用の特徴を特定する.文書間類似度は,機械学習(Doc2Vec)とn-gramの2つの方法を用いて算出する.韻律詩からなる『リグ・ヴェーダ』は,不規則なリズムが,歴史的な語形によって規則的なリズムパターンに復元されることがある.祖語に再建される喉音という音素による韻律復元を,詩節を作った詩人の観点から分析することによって,詩人Grtsamada と詩人Kanva はどちらも他の詩人らとは傾向が異なることがすでに知られている.そして,本論文は,韻律復元から完全に独立した文書間類似度という観点においても,詩人Grtsamada と詩人Kanva が特徴的であることを示す.『リグ・ヴェーダ』を詩人に着目して網羅的に分析するような前例はなく,言語使用が特徴的な詩人としてこの2人の詩人を特定することは新たな発見である.また,すでに知られる文献学的見地の検証,すなわち,詩人Visvamitra と詩人Vasistha の詩節が,n-gramの比較においてきわめて類似していることを確かめる.このように,本論文は,実践によってヴェーダ文献学における自然言語処理の意義および必要性をより明確にすることに貢献する.

This paper aims to verify the philological achievements by calculating the similarity between the verses that make up the Sanskrit literature “Rigveda” and identifying the language usage characteristics of the poets who created them. The document similarity is calculated using two methods: machine learning (Doc2Vec) and n-gram. The Rigveda, consisting of metrical poems, sometimes has irregular meters that can be restored to regular rhythm patterns by historical word forms. Through the analysis of metrical restoration from the perspective of the poets who created the verses, it is already known that the poets Grtsamada and Kanva have different tendencies from other poets. This paper also demonstrates that both poets are distinct in terms of document similarity that is completely independent of metrical restoration. It is a new discovery to identify these two poets by focusing comprehensively on poets in Rigveda without any precedent. Furthermore, this paper verifies already known philological perspectives, confirming that the verses of poets Visvamitra and Vasistha are extremely similar in n-gram comparison. Thus, this paper contributes to clarifying the significance and necessity of natural language processing in Vedic literature studies through practical research.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ