機械学習を用いた読唇技術の手法に関する研究

書誌事項

タイトル別名
  • Research on Method Study of Lip Reading Technology Using Machine Learning

説明

<p>近年,音声認識による文字化の技術が発展し,様々な場面で活用されている.しかし,騒がしい場所では認識率が低下する課題があり,この課題を解消するため,無音声でも認識できる可能性のある読唇技術によって文字化を試みたい.無音声でも文字化することが可能であれば,文字情報の必要な人にとり,騒がしい場所においてもコミュニケーションの一助となる期待があり,また,音声認識と組み合わせることによって認識率を高められる期待もある.これに関し,英語話者に対する読唇専用のソフトウェアの開発がされたが,母音の数の関係から,これを日本語に同様に適用することは難しいと考えられている.そこで本研究では,日本語話者を対象に,無音声の環境下で読唇技術を実現することが可能であるかどうか実験を行った.特定の場面においてよく用いられる文章6つに対し,10名の被験者に5回ずつ発話してもらいデータを収集した.収集したデータに対し,機械学習によって分類した結果, k-Nearest Neighbor による分類が最も精度が高かった.しかし,同時に被験者によって認識精度が異なることも明らかとなった.</p>

収録刊行物

キーワード

詳細情報 詳細情報について

  • CRID
    1390569845479721600
  • NII論文ID
    130008051836
  • DOI
    10.11517/pjsai.jsai2021.0_3h2gs9b03
  • ISSN
    27587347
  • 本文言語コード
    ja
  • データソース種別
    • JaLC
    • CiNii Articles
  • 抄録ライセンスフラグ
    使用不可

問題の指摘

ページトップへ