Voice Activity Detection in Captioning Musical Films

MUKAI Natsumi, KANEDERA Noboru, KITAGUCHI Sunao, ARAI Takayuki

doi:10.20763/inctkiyoupre.kj00004703660

【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
Trial version of CiNii Research Knowledge Graph Search feature is available on CiNii Labs
【Updated on June 30, 2025】Suspension and deletion of data provided by Nikkei BP
Regarding the recording of “Research Data” and “Evidence Data”

Voice Activity Detection in Captioning Musical Films

DOI Web Site

MUKAI Natsumi

石川高専専攻科電子機械工学専攻
KANEDERA Noboru
KITAGUCHI Sunao

石川高専電子情報工学科
ARAI Takayuki

上智大学

Bibliographic Information

Other Title

ミュージカル映画中の音声区間検出
ミュージカルエイガチュウノオンセイクカンケンシュツ

Search this article

Description

The process of detecting portions involving utterances, which is essential for captioning films, is generally carried out manually by translators at present. Robust methods are inevitable for automatic voice activity detection (VAD) in films involving other irrelevant sound information such as background music. This paper proposes a new feature for automatic VAD. The proposed method utilizes the gradient of spectrum in high-frequency domain (4-6kHz) and the standard deviation of modulation-filtered cepstrum. For evaluation experiments, we used a portion (about 23 minutes) of an English musical film. The proposed method exhibits a 22.6% reduction in total error rate compared to the conventional one utilizing the short time energy.

Journal

National Institute of Technology,Ishikawa College Bulletin

National Institute of Technology,Ishikawa College Bulletin 39 (0), 51-56, 2007

National Institute of Technology,Ishikawa College

Keywords

Details 詳細情報について

CRID

1390282679592824832
NII Article ID

110006407980
NII Book ID

AN00014363
DOI

10.20763/inctkiyoupre.kj00004703660
ISSN

24242152

02866110
NDL BIB ID

8898754
Web Site

http://id.ndl.go.jp/bib/8898754

https://ndlsearch.ndl.go.jp/books/R000000004-I8898754
Text Lang

ja
Data Source
- JaLC
- NDL Search
- CiNii Articles
Abstract License Flag
Disallowed

Voice Activity Detection in Captioning Musical Films

Bibliographic Information

Search this article

Description

Journal

Keywords

Details 詳細情報について

Export

Report a problem