文書クラスタリングによる未解読文書の解読可能性の判定 : ヴォイニッチ写本の事例

書誌事項

タイトル別名
  • ブンショ クラスタリング ニ ヨル ミカイドク ブンショ ノ カイドク カノウセイ ノ ハンテイ : ヴォイニッチ シャホン ノ ジレイ
  • Bunsho kurasutaringu ni yoru mikaidoku bunsho no kaidoku kanosei no hantei : Voinitchi shahon no jirei
  • Determining the possibility of deciphering an unintelligible text by text clustering: the case of the Voynich Manuscript

この論文をさがす

抄録

type:text

【目的】 未解読文書に関する研究は、文書内容の解読に焦点を当てたものが多い。 しかし、長年にわたって解読不能である文書は、何らかの意図で作成された意味をなさない「捏造文書」 であり、そもそも解読自体ができない可能性もありうる。 本研究の目的は、文書構造の有無から解読可能性そのものを判定する手法を提案することである。 【方法】 既存の多くの言語に応用可能なテキスト処理技術は未解読文書に対しても有効であるという前提に基づき、未解読文書の部分文書同士の類似度をクラスタリング手法によって分析することにより、首尾一貫した文書構造の有無を検証する。 次に、本書構造と、図表やページ順など他の手がかりから導かれる構造との対応関係を比較 分析することによって、「捏造文書」を判定する 。 【結果】 提案手法を用いて有名な未解読文書であるヴォイニッチ写本を分析した結果、本文の構造と挿図・ページから推測される構造が一致することが明らかになった。つまり、ヴォイニッチ写本は一貫性のある構造を持つ文書であり、「捏造文書」ではない可能性が高いと判定できる。実験により提案手法の適用可能性を示すことができた。

原著論文

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ