- 【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
- Trial version of CiNii Research Knowledge Graph Search feature is available on CiNii Labs
- 【Updated on June 30, 2025】Suspension and deletion of data provided by Nikkei BP
- Regarding the recording of “Research Data” and “Evidence Data”
A Study on Robust Feature Extraction Using Kernel PCA in Reverberant Environments
Bibliographic Information
- Other Title
-
- Kernel PCAを用いた残響下におけるロバスト特徴量抽出の検討
- Kernel PCA オ モチイタ ザンキョウ カ ニ オケル ロバスト トクチョウリョウ チュウシュツ ノ ケントウ
- 音声言語
Search this article
Description
本稿では,Kernel PCA(Principal Component Analysis)を用いた雑音や残響にロバストな特徴量抽出手法について検討する.画像の分野では,Kernel PCA は雑音除去などに優れた性能を発揮することが知られている(Mika ら(1999)).たとえば,画質の粗い画像を高画質な画像へと変換を行うSuper-Resolution なども提案されている(Kim ら(2004)).一方,これまでKernel PCA を音声特徴量抽出において適用した研究も行われてきている.たとえばLima ら(2004 2005) では,クリーン音声に対してMFCC 計算後,音声のスペクトル包絡成分に対応する低次ケプストラムに対して,Kernel PCA を適用した結果が報告されている.これまで,様々な雑音除去手法について研究が行われてきているが,残響や非定常雑音などを完全に除去することは困難であり,まだ課題が残されている.従来の雑音除去手法の多くは,スペクトル領域において演算が行われ,認識時には,(対数スペクトルに対し)離散コサイン変換が適用され,特徴量としてケプストラムが使われる.本稿では,残響音声に対してロバストな特徴量抽出法として,離散コサイン変換の代わりにKernel PCA を用いた手法を提案し,残響下音声認識により,その有効性を示す.
We investigate robust feature extraction using kernel PCA (Principal Component Analysis). Kernel PCA has been suggested for various image processing tasks requiring an image model such as, e.g., denoising (Mika, et al. (1999)). Image denoising is the task of constructing a noise-free image from a noisy input image. From the point of view of a kernel PCA, image denoising can be also regarded as the same problem as image super-resolution (Kim, et al. (2004)). Also, an approach for feature extraction in speech recognition systems using kernel PCA has been proposed (Lima, et al. (2004, 2005)), where kernel PCA was applied to the low-dimension cepstrums. Much research for noise-robust feature extraction has been done, but it is difficult to remove the reverberation or non-stationary noise. The most commonly used noise-removal techniques are based on the spectral-domain operation, and then for the speech recognition MFCC (Mel Frequency Cepstral Coefficients) are computed, where DCT (Discrete Cosine Transformation) is applied to the mel-scale filter bank output. In this paper, we propose robust feature extraction based on kernel PCA instead of DCT. Its effectiveness is confirmed by word recognition experiments on reverberant speech.
Journal
-
- 情報処理学会論文誌
-
情報処理学会論文誌 47 (6), 1767-1773, 2006-06-15
東京 : 情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050564287835962624
-
- NII Article ID
- 110004729738
-
- NII Book ID
- AN00116647
-
- ISSN
- 18827764
- 03875806
-
- NDL BIB ID
- 7993282
-
- Text Lang
- ja
-
- Article Type
- journal article
-
- Data Source
-
- IRDB
- NDL Search
- CiNii Articles
- KAKEN