『昭和話し言葉コーパス』の設計と構築

書誌事項

タイトル別名
  • Design and Construction of the Showa Speech Corpus

抄録

国立国語研究所基幹研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,2016年度より『昭和話し言葉コーパス』(SSC: Showa Speech Corpus)の構築を進めてきた。2021年3月にその構築作業が完了し,コーパス検索アプリケーション「中納言」で一般公開を開始した。『昭和話し言葉コーパス』は,1950年代から1970年代にかけて国立国語研究所で作成された録音資料群を再編成し,現代の技術で話し言葉コーパスとして整備したものである。過去の音源を現代の技術でコーパス化したという点において,日本語では従来存在しなかったタイプのコーパスであると言える。また,現代の話し言葉コーパスと連結し,比較・対照することによって,話し言葉の経年変化を探るための「通時音声コーパス」として利用できる点で,画期的である。本稿では,今回構築した『昭和話し言葉コーパス』について,そこに収録されている録音資料群の出自や当時の国立国語研究所の状況,コーパス構築の過程とアノテーション,さらに予備的な分析結果について述べる。

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ