共変量シフトの問題としての語義曖昧性解消の領域適応

書誌事項

タイトル別名
  • Domain Adaptations for Word Sense Disambiguation under the Problem of Covariate Shift
  • キョウ ヘンリョウ シフト ノ モンダイ ト シテ ノ ゴギアイマイセイ カイショウ ノ リョウイキ テキオウ

この論文をさがす

抄録

本稿では語義曖昧性解消 (Word Sense Disambiguation, WSD) の領域適応が共変量シフトの問題と見なせることを示し,共変量シフトの解法である確率密度比を重みにしたパラメータ学習により,WSD の領域適応の解決を図る.共変量シフトの解法では確率密度比の算出が鍵となるが,ここでは Naive Bayes で利用されるモデルを利用した簡易な算出法を試みた.そして素性空間拡張法により拡張されたデータに対して,共変量シフトの解法を行う.この手法を本稿の提案手法とする.BCCWJ コーパスの 3 つ領域 OC (Yahoo! 知恵袋),PB(書籍)及び PN(新聞)を選び,SemEval-2 の日本語 WSD タスクのデータを利用して,多義語 16 種類を対象に,WSD の領域適応の実験を行った.実験の結果,提案手法は Daumé の手法と同等以上の正解率を出した.本稿で用いた簡易な確率密度比の算出法であっても共変量シフトの解法を利用する効果が高いことが示された.より正確な確率密度比の推定法を利用したり,最大エントロピー法の代わりに SVMを利用するなどの工夫で更なる改善が可能である.また教師なし領域適応へも応用可能である.WSD の領域適応に共変量シフトの解法を利用することは有望であると考えられる.

収録刊行物

  • 自然言語処理

    自然言語処理 21 (1), 61-79, 2014

    一般社団法人 言語処理学会

被引用文献 (1)*注記

もっと見る

参考文献 (8)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ