東北方言昔話に関する歴史的音声コーパスと機械学習ベース自動音声復元の試み

書誌事項

タイトル別名
  • Historical speech corpus of Tohoku dialect folktales and machine learning-based speech restoration

抄録

本研究では,歴史的音声の復元と保存を目的として,東北方言昔話を例としたディジタル音声コーパスの作成と,機械学習に基づく自動音声復元技術の開発について述べる.アナログ記録媒体に保存された歴史的音声の散逸と劣化を防ぐために,音声のディジタル化と復元が急務の課題である.本論文では,1950年代から1980年代にかけて宮城県と岩手県の一部を中心に収集された昔話をディジタル化し,そのアノテーションと復元の結果を報告する.アノテーション結果を含む音声コーパスと音声復元技術は,オープンソースとして公開している.

This paper presents developments of 1) the digital speech corpus of Tohoku dialect folktales and 2) machine learning-based automatic speech restoration. In order to prevent the dissipation and deterioration of historical audio stored on analog recording media, digitization and restoration of the audio is an urgent issue. This paper reports the results of digitization, annotation, and restoration of the folktales collected mainly in Miyagi and Iwate prefectures from the 1950s to the 1980s. The speech corpus is open-sourced, including the annotation results and the speech restoration technique.

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ