Japanese Sentence Dataset for Lip- reading

Takeshi Saitoh, Tatsuya Shirakata

doi:10.23919/mva51890.2021.9511353

【2025年5月12日更新】CiNii Dissertations及びCiNii BooksのCiNii Researchへの統合について
CiNii Research自動翻訳機能（試行版）をCiNii Labsにて公開しました
日経BP社提供データの更新停止及び削除について
「研究データ」「根拠データ」の収録について

Japanese Sentence Dataset for Lip- reading

DOI

Takeshi Saitoh
Tatsuya Shirakata

説明

This research is about lip-reading for Japanese sentences. Research on English sentences is actively pursued due to the extensive datasets. However, a sufficient dataset for Japanese sentences has not been released. Therefore, this paper builds a Japanese sentence dataset. A Transformer model is used for the recognition task. Three recognition target levels: phoneme, mora, and vowel, are set, and recognition experiments show that they can be recognized.

収録刊行物

2021 17th International Conference on Machine Vision and Applications (MVA)

2021 17th International Conference on Machine Vision and Applications (MVA) 1-5, 2021-07-25

IEEE

詳細情報詳細情報について

CRID

1871991017890222208
DOI

10.23919/mva51890.2021.9511353
データソース種別
- OpenAIRE

書き出し

RefWorksに書き出し
EndNoteに書き出し
Mendeleyに書き出し
RDFで書き出し
Refer/BibIXで表示
RISで表示
BibTeXで表示
TSVで表示
CSVで表示
JSON-LDで表示

問題の指摘

ページトップへ

Japanese Sentence Dataset for Lip- reading

説明

収録刊行物

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について