Building a Corpus at IPA
Bibliographic Information
- Other Title
-
- IPAにおけるテキストコーパスの作成
Search this article
Description
IPA技術センターでは、動詞・形容詞・名詞辞書を作成する過程で見出し語の分析のために新聞、教科書、文芸作品などの実例をデータベース化してきた。けれども単語分割や品詞情報付加などの手を加えていないため、検索効率が悪い。そこで今回、一部のテキストに対し、単語分割と品詞情報付加を行なうことにした。欧米に比べ、日本ではコーパスと呼ばれるような電子化された言語データの作成および共有化が遅れている。IPAのような公共機関が、電子化データを公開することが望ましい。そこで、単語に分割し、品詞情報を付加したデータベースを、「IPAコーパス」と名付け、一般公開することにした。当稿では、IPAコーパスに収録するテキストや、付加する品詞情報について報告する。
Journal
-
- 全国大会講演論文集
-
全国大会講演論文集 第51回 (人工知能と認知科学), 35-36, 1995-09-20
情報処理学会
- Tweet
Details 詳細情報について
-
- CRID
- 1050855522087982080
-
- NII Book ID
- AN00349328
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB