テキストマイニングと単語ベクトルを援用した英米文学研究の試み

DOI

書誌事項

タイトル別名
  • An Approach to the Study of English and American Literature Using Text Mining and Word Vectors
  • Interpreting Herman Melville's <i>Typee</i> from the Perspective of Natural Language Processing

抄録

<p>善と悪の悪は悪いことであるが、英米文学の作家スタインベックは、若干異なる意味で使っている。必ずしもネガティブなものとして捉えていないのである。海洋生物学への関心から、生物にとって重要なのは生き延びることであり、そのためにはずる賢いことも重要だと考えているからである。このように作家が使う言葉が持つ意味の含意と、私たちが使う言葉のそれとでは差異が生じている。その差異を見つけ、作家固有のイメージ世界を再構築することが、作品解釈の手がかりの一つとなる。これまでの文学研究では、文献でそれを論証してきたが、ここではテキスト情報の数値化を援用することで試みる。具体的には、ハーマン・メルヴィルの『タイピー』を取り上げる。これまでの英米文学研究から明らかにされたキーワードと、テキストマイニングによって抽出された重要度の高い単語に、Word2vecを発展させたfastTextにより単語ベクトルを付与、それをfastTextの学習済みモデルにおける同単語の単語ベクトルとの類似度の差をもとに総合的に解釈を行った。その結果、このアプローチは、作品解釈の方法論の一つとして、有効であることが検証できた。</p>

収録刊行物

詳細情報

  • CRID
    1390006895527448448
  • NII論文ID
    130008052023
  • DOI
    10.11517/pjsai.jsai2021.0_4j4gs6g02
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ