円形マイクアレーを想定した球面調和関数展開に基づく近接/遠方音分離T-Fマスク推定

この論文をさがす

抄録

物理モデルと深層学習を組み合わせた近接/遠方音源分離手法について,実機マイクアレーを想定したシミュレーションにより,実環境実験に向けたT-Fマスク推定モデルの検討と音質評価実験を行った.深層学習による音源分離ではディープニューラルネットワークや長短期記憶ユニット(LSTM)を用いて,混合音から求めた音響特徴量から時間-周波数(T-F)マスクを推定する.本論文では球面調和関数展開に基づく近接音分離法により,低周波数領域の近接/遠方音を推定し,これを音響特徴量に加える.従来のLSTMによるT-Fマスク推定手法と比べて分離音声の音質を向上し,実環境を想定した条件下での提案法の有用性を示した.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ