CiNii Researchの本公開について

コーパスからの関係表現の自動抽出

書誌事項

タイトル別名
  • Automatically Extracting Connective Expressions from Corpora
  • コーパス カラ ノ カンケイ ヒョウゲン ノ ジドウ チュウシュツ

この論文をさがす

抄録

type:論文(Article)

本論文ではコーパスから関係表現を自動抽出する手法について述べる.関係表現とは「に関して」に代表される,助詞相当の働きを持ち,語の挿入や交換が一般に行えない慣用表現の一種である.関係表現は一般に一語として処理するのが有効であるが,その表現を収集することは容易ではない.なぜなら通常の表現と関係表現との違いは不明確であり,つきつめれば,その判定はシステム製作者の主観的な判断によって行われているからである.本論文ではコーパスから関係表現を自動抽出することで,網羅的,かつ統一的な関係表現の収集を目指した.特に本論文では,助詞+動詞+付属語(助詞,助動詞)の形を持つ関係表現を抽出することを試みた.本論文は上記の関係表現のもつ2つの特徴に注目する.1つは関係表現中の動詞は,接続的な利用が多く本動詞として利用されることが少ないこと,もう1つは,その動詞に前置する助詞との共起が強いため,動詞に前置する助詞は特異な出現頻度をとるという特徴である.この特徴を利用してまず関係表現中の動詞になりえるものをコーパス中のその語の使われ方の頻度から選出する.次に選出した動詞に前置する助詞をコーパスから収集し,助詞の出現分布を調べることで関係表現を抽出する.

Connective expression is a kind of idiomatic phrase corresponding to postposition. Typical example is "NI-NANSI-TE". Generally it is advantageous to handle these expressions as one word, but it is difficult to pick up these expressions. Because it is unclear to distinguish connective expression from normal expression. This paper aims at picking up automatically connective expressions from corpora. We utilize two properties of connective expressions. One is that the verb in connective expression is almost used as connective form and rarely used as main verb. Another is that the verb and postposition in front of the verb are strongly connected. Counting forms of all verbs in corpora, we can pick up verbs which are able to become a part of connective expression. Next, examining the number of postpositions in front of these verbs. Lastly we can extract connective expressions.

収録刊行物

被引用文献 (0)

もっと見る

参考文献 (0)

もっと見る

関連論文

もっと見る

関連研究データ

もっと見る

関連図書・雑誌

もっと見る

関連博士論文

もっと見る

関連プロジェクト

もっと見る

関連その他成果物

もっと見る

詳細情報

ページトップへ