形態素解析による辞書学習

書誌事項

タイトル別名
  • learning of lexicon by morpheme analyze

この論文をさがす

抄録

日本語は膠着(こうちゃく)語の文である。膠着語の文は文字列が羅列してあるだけで、文の中の単語がはっきりしていない。そのため、文字列の中から単語を切り出すとき、文中に未知語が出くることがあり、未知語に対して品詞の情報を得るための処理を行なわなければならない。その処理を、未知語が出てきたときにその都度処理をしていたのでは面倒である。例えば、新聞の記事に頻繁に出てくる固有名詞など未知語になることが多い。その固有名詞に対し折角未知語処理を行っても、それを記憶せずに捨ててしまうのはかなり無駄なことである。そこで、品詞獲得の処理で得られた情報を、補助の辞書に保持しておき、獲得される品詞情報を数度の解析に上って同じ情報を得られたときに、システムの辞書に登録するという方法考察する。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ