A Proposal of Acoustic Parameters to Estimate Listener's Preference for Voice Quality of Singing in J-POP Songs

Bibliographic Information

Other Title
  • J-POP楽曲における歌声の声質を対象とした嗜好性の推定のための音響パラメータの提案
  • J-POP ガッキョク ニ オケル ウタゴエ ノ セイシツ オ タイショウ ト シタ シコウセイ ノ スイテイ ノ タメ ノ オンキョウ パラメータ ノ テイアン

Search this article

Description

近年,IT技術の急激な成長の結果,デジタルデバイスの小型化,大容量化,さらには,音楽定額制音楽配信サービスの出現により,個人が聴取可能な音楽の幅が増大し,ユーザは数万曲以上の大量の音楽データから聴取する楽曲を選択することが必要となった.そのような時代背景の中,音楽情報検索(MIR:Music Information Retrieval,以下MIR)と呼ばれる研究分野では,楽曲選択の一助となる楽曲推薦技術が盛んに議論されるようになった.MIRの分野では,様々な楽曲推薦に関する技術が報告されており,その1つに「歌声の類似度」の推定を行なった研究がある.しかし,この研究では,歌声の声質に関する部分と歌い方に関する部分が切り分けられていない.そこで,本論文では,歌声の声質に着目し,その嗜好性を推定するための音響パラメータの提案,そして,音響パラメータの有効性を検証するために,歌声における声質の嗜好性を目的変数,算出された音響パラメータを説明変数とした機械学習を行なっている.歌声の声質に関する音響パラメータを設計するにあたって,音響パラメータを取得する対象となる音響信号は歌声のみの音源であることが望ましいものの,歌声のみの楽曲よりも伴奏を伴った楽曲の方がマジョリティであるため伴奏を伴った楽曲から歌声抽出技術によって得られた歌声音源を用いている.得られた音響信号に対し,歌声の倍音構造に着目したパラメータを2つ,倍音構造の傾向を表すパラメータを9つ,これらを組み合わせた18通りの音響パラメータを新たに設計し,さらに,基礎的な音響分析に用らいれている2通りのパラメータを加えた,計20通りの音響パラメータを提案している.また,目的変数となる歌声の嗜好性については,10名の聴取者に1曲5秒程度の伴奏を伴った歌声を聴取させ,その声質について,「好みである/好みでない」を2件法で回答させている.これらの説明変数,目的変数を用いて,聴取者毎にランダムフォレストによる推定を行ない,推定結果をF-measureで評価している.10名の回答に対するF-measureの平均値は,基礎的な音響分析に用いる音響パラメータのみを用いた場合より,新たに設計したパラメータのみを用いた場合の方が0.09ポイント上昇しており,さらに,チャンスレベルである50%を超えていることから,提案パラメータの有効性が示唆されている.歌声における声質に対する嗜好性の個人差に関して,更なる検討は必要であるものの,歌声に含まれる倍音という特徴が好みを決定づける要因であることが第一次近似的に示されている.一方,聴取者の判断基準のいくつかが音響パラメータに反映できていない可能性が高く,それらの音響パラメータを設計することで今後の研究へと適用される可能性が見いだされた.

Journal

Details 詳細情報について

Report a problem

Back to top