IPAにおけるテキストコーパスの作成

書誌事項

タイトル別名

Building a Corpus at IPA

説明

IPA技術センターでは、動詞・形容詞・名詞辞書を作成する過程で見出し語の分析のために新聞、教科書、文芸作品などの実例をデータベース化してきた。けれども単語分割や品詞情報付加などの手を加えていないため、検索効率が悪い。そこで今回、一部のテキストに対し、単語分割と品詞情報付加を行なうことにした。欧米に比べ、日本ではコーパスと呼ばれるような電子化された言語データの作成および共有化が遅れている。IPAのような公共機関が、電子化データを公開することが望ましい。そこで、単語に分割し、品詞情報を付加したデータベースを、「IPAコーパス」と名付け、一般公開することにした。当稿では、IPAコーパスに収録するテキストや、付加する品詞情報について報告する。

収録刊行物

全国大会講演論文集

全国大会講演論文集第51回 (人工知能と認知科学), 35-36, 1995-09-20

情報処理学会

詳細情報詳細情報について

CRID: 1050855522087982080

NII書誌ID: AN00349328

Web Site: https://ipsj.ixsq.nii.ac.jp/records/128460

本文言語コード: ja

資料種別: conference paper

データソース種別

IRDB

書き出し

問題の指摘