畳み込み変分オートエンコーダとガウス過程に基づく動画像の分節化

長野 匡隼, 中村 友昭, 長井 隆行, 持橋 大地, 小林 一郎, 高野 渉

doi:10.11517/pjsai.jsai2021.0_2j3gs8b01

書誌事項

タイトル別名

Unsupervised Segmentation for Video Using Convolutional VAE and Gaussian Process

説明

<p>本稿では，時系列の画像データを教師なしで分節化する手法を提案する．人は知覚した高次元の時系列情報を意味を持つ単語や単位動作に分節・分類することで認識している．ロボットが単語や動作を柔軟に学習するためにも，このような教師なしで分節・分類する能力は重要であると考えられる．そこでこれまでに，深層生成モデルと統計モデルを組み合わせたHierarchical Dirichlet Processes-Variational Autoencoder-Gaussian Process-Hidden Semi-Markov Model (HVGH)により，教師なしで高次元の時系列データの特徴抽出と，単位系列への分節・分類を可能とした．HVGHは，VAEにより高次元データを分節化に適した低次元の潜在変数へと圧縮し，その遷移をガウス過程を用いて表現することで，高次元の複雑な時系列データの分節化を可能とする．本稿では，HVGHを拡張することにより，時系列の画像情報の分節・分類が可能な手法を提案する．実験では，3次元迷路のエージェント視点の動画像データを用いて，提案手法による分節・分類の推定精度が既存手法より高いことを示す．</p>

収録刊行物

人工知能学会全国大会論文集

人工知能学会全国大会論文集 JSAI2021 (0), 2J3GS8b01-2J3GS8b01, 2021

一般社団法人人工知能学会

キーワード

詳細情報詳細情報について

CRID: 1390288370500613760

NII論文ID: 130008051749

DOI: 10.11517/pjsai.jsai2021.0_2j3gs8b01

ISSN: 27587347

本文言語コード: ja

データソース種別

JaLC
CiNii Articles

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘