CycleGANを用いた音源分離の倍音成分に着目した手法の検討

この論文をさがす

抄録

ある曲のデータから特定の楽器音や人間の声を分離することを音源分離と呼び、音源分離ではバンドを対象にした研究が多く行われている。そこで、人間の声が含まれていないオーケストラや吹奏楽曲のみを対象にし、はじめに木管アンサンブルから1つの楽器を分離させることを目的とする。本報告では木管アンサンブルから特定の楽器音を分離させる手法として、CycleGANを用いたスペクトログラムの画像処理、そして楽器音の倍音成分に着目した画像処理を提案する。スペクトログラムを、2種類の画像間の変換方法を学習して画像生成するCycleGANと、楽器ごとに倍音成分が異なることに注目した加工処理の2通りの方法で変換し、性能を確かめた。詳細は発表で述べる。

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ