音声言語コーパスにおける speaking style の自動推定―転記テキストに着目して―

書誌事項

タイトル別名
  • Automatic Estimation of Speaking Style in Speech Corpora Focusing on Speech Transcriptions
  • オンセイ ゲンゴ コーパス ニ オケル speaking style ノ ジドウ スイテイ : テンキ テキスト ニ チャクモク シテ

この論文をさがす

抄録

近年,計算機技術の進歩に伴って大規模言語データの蓄積と処理が容易となり,音声言語コーパスの構築と実用化の研究が盛んに行われている.我々は,speaking style に関心を持つ利用者に音声言語コーパスを探しやすくさせるために,音声言語コーパスの speaking style の自動推定を目指している.本研究では,1993 年に Eskenazi が提唱した speaking style の 3 尺度を導入し,従来の文体・ジャンルの判別や著者推定などの自然言語処理の分野で用いられた言語の形態論的特徴を手がかりとし,音声に付随する書き起こしテキスト(本論文では転記テキストと呼ぶ)に着目した speaking style 推定モデルの構築を試みた.具体的な手続きとしては,はじめに様々な音声言語コーパスから音声に付随する転記テキストを無作為に抽出する.次にこれらの転記テキストを刺激として用い,3 尺度の speaking style の評定実験を行う.そして,評定結果を目的変数,転記テキストの品詞・語種率と形態素パタンを説明変数とし,重回帰分析により 3 尺度それぞれの回帰モデルを求める.交差検定を行った結果,本研究の提案手法によって 3 尺度の内 2 尺度の speaking style 評定値を高い精度で推定できることを確認した.

収録刊行物

  • 自然言語処理

    自然言語処理 21 (3), 445-464, 2014

    一般社団法人 言語処理学会

参考文献 (7)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ