畳み込み変分オートエンコーダとガウス過程に基づく動画像の分節化

書誌事項

タイトル別名
  • Unsupervised Segmentation for Video Using Convolutional VAE and Gaussian Process

説明

<p>本稿では,時系列の画像データを教師なしで分節化する手法を提案する. 人は知覚した高次元の時系列情報を意味を持つ単語や単位動作に分節・分類することで認識している.ロボットが単語や動作を柔軟に学習するためにも,このような教師なしで分節・分類する能力は重要であると考えられる.そこでこれまでに,深層生成モデルと統計モデルを組み合わせたHierarchical Dirichlet Processes-Variational Autoencoder-Gaussian Process-Hidden Semi-Markov Model (HVGH)により,教師なしで高次元の時系列データの特徴抽出と,単位系列への分節・分類を可能とした.HVGHは,VAEにより高次元データを分節化に適した低次元の潜在変数へと圧縮し,その遷移をガウス過程を用いて表現することで,高次元の複雑な時系列データの分節化を可能とする.本稿では,HVGHを拡張することにより,時系列の画像情報の分節・分類が可能な手法を提案する.実験では,3次元迷路のエージェント視点の動画像データを用いて,提案手法による分節・分類の推定精度が既存手法より高いことを示す.</p>

収録刊行物

詳細情報 詳細情報について

  • CRID
    1390288370500613760
  • NII論文ID
    130008051749
  • DOI
    10.11517/pjsai.jsai2021.0_2j3gs8b01
  • ISSN
    27587347
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ