Real-time speech interface based on the fusion of audio and video information for humanoid robot HRP-2

  • Yamamoto Kiyoshi
    筑波大学大学院システム情報工学研究科
  • Asano Futoshi
    産業技術総合研究所情報技術研究部門メディアインタラクショングループ
  • Hara Isao
    産業技術総合研究所情報技術研究部門メディアインタラクショングループ
  • Ogata Jun
    産業技術総合研究所情報技術研究部門メディアインタラクショングループ
  • Asoh Hideki
    産業技術総合研究所情報技術研究部門メディアインタラクショングループ
  • Yamada Takeshi
    筑波大学大学院システム情報工学研究科
  • Kitawaki Nobuhiko
    筑波大学大学院システム情報工学研究科

Bibliographic Information

Other Title
  • ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース(<特集>システム論文特集号)
  • ヒューマノイドロボットHRP-2における音響情報と画像情報を統合したリアルタイム音声インタフェース
  • ヒューマノイドロボット HRP 2 ニ オケル オンキョウ ジョウホウ ト ガゾウ ジョウホウ オ トウゴウ シタ リアルタイム オンセイ インタフェース

Search this article

Abstract

ロボットが雑音の存在する実環境で人とコミュニケーションするための,ロバストな音声インタフェースを開発した。本インタフェースは,(a)音響情報と画像情報の統合による発話区間検出,(b)適応ビームフォーマを用いた音源分離,(c)音声認識におけるモデル適応,の三つのロバスト化技術を統合することにより構成されている。本研究では,このシステムをロボットが利用可能な計算資源でリアルタイムに実現するため,専用ハードウェアRASP-2を開発した。更に実環境での評価・改良を行うため,音声インタフェースを利用した,ロボットとネットワークに接続された情報家電の制御を行うアプリケーションを開発し,評価実験を行った。

Journal

Citations (5)*help

See more

References(23)*help

See more

Details 詳細情報について

Report a problem

Back to top