現代日本語書き言葉均衡コーパス(BCCWJ)

メタデータ

公開日
2011
タイトル別名
  • The Balanced Corpus of Contemporary Written Japanese (BCCWJ)

抄録

『現代日本語書き言葉均衡コーパス』(BCCWJ)は、現代日本語の書き言葉の全体像を把握するために構築したコーパスであり、現在、日本語について入手可能な唯一の均衡コーパスです。書籍全般、雑誌全般、新聞、白書、ブログ、 ネット掲示板、教科書、法律などのジャンルにまたがって1億430万語のデータを格納しており、各ジャンルについて無作為にサンプルを抽出しています。

関連論文

もっと見る

関連図書・雑誌

もっと見る

関連博士論文

もっと見る

関連その他成果物

もっと見る

詳細情報 詳細情報について

ページトップへ