発話を先読みしマイクミュート制御をするマルチモーダル発話検知技術

Abstract

本研究では,音声通話における自動マイクミュート制御のために,従来技術を用いた場合の2つの課題である,話頭切れと周囲雑音の誤検知を防止するため,口唇の変動に基づき発話開始を先読みしてマイクを有効化し,口唇の変動と音声信号に基づき非発話中と推定されたときにマイクを無効化するミュート制御手法を提案する.また本研究では,共話を行っているオンラインコミュニケーションの収録動画を用いて提案技術の評価を行い,収録動画の全発話の内の 99.1% の発話を話頭切れを含む発話区間の欠損無く検出でき,共話のユースケースでも十分に実用性があることを示す.

Journal

Details 詳細情報について

Report a problem

Back to top