Multi-modal Few-shot One-class Image Classification の為のメタラーニング手法の提案

書誌事項

タイトル別名
  • Meta-learning Method for Multi-modal Few-shot One-class Image Classification

説明

<p>One-class Image Classification (OCIC) は入力画像が特定のクラスに属するか否かを識別する機械学習タスクであり,本タスクは視覚的な概念認識の為に重要である. 人間は少数データのみを用いて概念認識を高い精度で行うことができ,先行研究で提案されているFew-shot Learning手法の性能は人間と比較すると大きく劣っている. この性能を高めるために,我々は「Multi-modal Belongingness Network (MMBeNet)」を提案する. MMBeNetは「Belongingness Network」と呼ばれるFew-shot OCIC手法を、少数の画像データに加えて「属性」や「Word Vector」といった意味情報を用いる目的で拡張した手法である. このように少数画像と意味情報からOCICを解くタスクを我々は「Multi-modal Few-shot One-class Image Classification」と呼ぶ. 我々は意味情報を視覚的概念認識能力に対する重要な要素とみなし,実際に意味情報を用いることで精度を高めることが可能であることを実験によって確かめた.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390006895525114496
  • NII論文ID
    130008051889
  • DOI
    10.11517/pjsai.jsai2021.0_4i1gs7b02
  • ISSN
    27587347
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ