複数音像の再現のためのDiffusionモデルを用いたバイノーラル音声変換
この論文をさがす
抄録
コンサートホールでの録音は会場上部に吊り下げられているマイクでされている。その録音機は HRTF(頭部伝達関数) を意識された録音がされておらず会場の臨場感を録音することができない。バイノーラル録音できる機材は市販されているものの、値段が高く手に届かないことやバイノーラルマイクの見た目がコンサートホールの景観を損なうなどの理由で使われていない。その問題を解決するために、研究では空間音響と HRTFを音源と音源の位置を用いて学習したモデルを使い、通常のステレオ音源をバイノーラル音源へと変換する。この研究により音楽配信サービスなどのストリーミング音声の臨場感の向上や、バイノーラルオーディオ作成のコストが格段に減ることを期待する。
収録刊行物
-
- 第85回全国大会講演論文集
-
第85回全国大会講演論文集 2023 (1), 367-368, 2023-02-16
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050298278493526016
-
- NII書誌ID
- AN00349328
-
- Web Site
- http://id.nii.ac.jp/1001/00230339/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB