カエルの合唱音声に対する教師ありモノラル音源分離のためのスペクトル構造を用いたデータ拡張

DOI

書誌事項

タイトル別名
  • Data Augmentation Using Spectral Structure for Supervised Monaural Source Separation of Frog Choruses

抄録

<p>カエルの合唱において,個体間の相互作用などの解析には,混合音から個体の鳴き声を分離する音源分離が必要である.特に,野外ではカエルが群れで密集している場合や,マイクとの位置の関係が不明な場合がある.このような条件での分離には教師ありモノラル音源分離が有望である.音源分離モデルの学習には,多数の鳴き声データが必要である.一方,学習データのために鳴き声を収集するのは困難で,多数の個体を捕獲し各個体の鳴き声を録音する必要がある.本研究では,少数の鳴き声データを使用し,鳴き声の特徴に注目したデータ拡張を行う.鳴き声は個体の大きさや気温により,周波数や発声間隔などに相違が見られるという特徴が知られている.まず,鳴き声の個体内や個体間のスペクトル構造といった特徴を分析する.次に,分析結果に基づき,鳴き声の基本周波数の変調や時間伸縮を行い学習データ内の鳴き声のパターンを増やす.データ拡張した鳴き声を用いて,2匹のカエルの音源分離実験を行った.データ拡張の有無により,分離精度向上への有効性を信号対歪比で確認した.</p>

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ