自然言語 言語コーパスからの語の共起性の推定
Bibliographic Information
- Other Title
-
- 言語コーパスからの語の共起性の推定
- シゼン ゲンゴ ゲンゴ コーパス カラ ノ ゴ ノ キョウキセイ ノ スイテイ
- Estimation of Words' Cooccurrency from Corpus
- 自然言語
Search this article
Abstract
語の共起性は自然言語処理における基本的な知識の1つであり,これを利用して,自然言語文の統語的曖昧さや多義語の語義の曖昧さを解消することができる.本論文では,構文解析済みの言語コーパスから得られる共起データを基にして,語の共起性を推定する手法を提案する.係る語を実ベクトル(ワードベクトル)に対応させ,これを説明変量とする重回帰モデルにより語の共起性を推定する.通常の重回帰分析と異なり,説明変量であるワードベクトルも同時に学習することが本手法の特徴である.
Words' Cooccurrency is one of the basic knowledge in Natural Language Processing, and it is used for syntactic disambiguation and word sense disambiguation. This paper proposes a new method for estimating words' cooccurrency with a syntactically analized corpus based on the multiple regression model. Independent variables of this model correspond to a satellite word (an independent word). Unlike the ordinary multiple regression analysis, the independent variables are also parameters of this model.
Journal
-
- 情報処理学会論文誌
-
情報処理学会論文誌 45 (1), 324-332, 2004-01-15
東京 : 情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050564287837216640
-
- NII Article ID
- 110002712061
-
- NII Book ID
- AN00116647
-
- ISSN
- 18827764
- 03875806
-
- NDL BIB ID
- 6935885
-
- Text Lang
- ja
-
- Article Type
- journal article
-
- Data Source
-
- IRDB
- NDL
- CiNii Articles