単語分布類似度を用いた類推による単語間の意味的関係獲得法

書誌事項

タイトル別名
  • タンゴ ブンプ ルイジド オ モチイタ ルイスイ ニ ヨル タンゴ カン ノ イミテキ カンケイ カクトクホウ
  • Analogy-based Relation Acquisition Using Distributionally Similar Words

この論文をさがす

抄録

情報爆発の時代に入り,大規模コーパスと計算機パワーの増大を背景に,構文的パターンに基づいて「因果関係」などの単語間の意味的関係の知識を獲得する研究が進められている.しかしながら,それらの研究は,文書中に直接的かつ明示的に書かれた知識を獲得するにとどまり,人間であれば解釈可能な間接的記述から獲得することや,文書に書かれていない知識を過去に蓄積された知識からの推論によって大規模に獲得することは行われていない.このような知識の獲得は,より大量の関係を獲得するためだけではなく,人類のイノベーションの加速にとっても重要である.本稿では,既存の構文的パターンに基づく方法で獲得された単語の意味的関係のデータベース,すなわち,特定の意味的関係を持つ単語対の集合を,類推によって大規模に拡張する方法を提案する.提案法は,入力された単語対の中の語を,ウェブから自動獲得した類似語に置換して大量の仮説を生成し,さらに単語間の類似度に基づいて仮説をランキングする.提案法は,従来法では困難な間接的記述からの意味的関係獲得を可能にして,さらには,そもそも文書に記述されている可能性が低い知識を獲得できる.約1億ページのウェブ文書を用いた実験によって,これらを検証するとともに,いくつかの意味的関係に関して,提案法で上位にランキングされた仮説では,最新の構文パターンに基づく獲得法とほぼ変わらない精度を達成できることを示す.

With the advent of terabyte scale corpora in this information explosion age, extracting high-level semantic relations like causality using lexico-syntactic patterns has come of age. While such knowledge acquisition methods have matured greatly, they are necessarily limited to extracting relations mentioned explicitly in some text collection. Until now, inference-based methods for acquiring “indirect” or “implicit” relational knowledge from a corpus have never been investigated on the same scale as pattern-based methods. In this work we propose a method for extending a database of semantic relations acquired by existing pattern-based methods using analogical reasoning. This method uses lexical word similarities acquired automatically from the Web to generate and rank new relation instance candidates from its input. Not only can it acquire semantic relations from indirect descriptions in the corpus, which is exceedingly difficult for pattern-based methods, our method can acquire valid relational knowledge that is unlikely to be written down before. We validate these claims experimentally using a 108 Web page corpus, and show that for some relations our method exhibits precision figures indistinguishable from state-of-the-art pattern-based methods in top-ranked relation instances.

収録刊行物

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ