音楽クリップのサムネイル画像から音楽情報以外のアスペクト情報は抽出できるのか？

元満 丈寛, 林 克彦, 坂井 優介, 上垣外 英剛

doi:10.57413/wii.19.0_7

抄録

<p>近年，自然言語を用いた音楽検索・生成モデルの研究が盛んに行われている．これらモデルの学習や評価には，音楽とテキストの対応データが必要となるが，規模の大きな公開データはほとんど存在しない．特に，自然言語による音楽の説明記述として，聴きたいシチュエーションや季節等の非音楽的なアスペクト情報は重要であるが，このようなアスペクトが記述された音楽キャプションデータは少ない．この問題に対処するため，本研究ではサムネイル画像から想起される非音楽的なアスペクト（聴きたいシチュエーションや時間，季節，聴いた時の感情）を付与した音楽キャプションデータの生成法を提案し，人手評価によって提案手法の有効性を確認した.</p>

収録刊行物

Webインテリジェンスとインタラクション研究会予稿集

Webインテリジェンスとインタラクション研究会予稿集 19 (0), 7-10, 2023

Webインテリジェンスとインタラクション研究会

キーワード

詳細情報詳細情報について

CRID: 1390298930854570496

DOI: 10.57413/wii.19.0_7

ISSN: 27582922

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用可

音楽クリップのサムネイル画像から音楽情報以外のアスペクト情報は抽出できるのか？

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

音楽クリップのサムネイル画像から音楽情報以外のアスペクト情報は抽出できるのか？

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について