Universal Dependencies 日本語コーパス

  • 浅原 正幸
    人間文化研究機構国立国語研究所
  • 金山 博
    日本アイ・ビー・エム株式会社東京基礎研究所
  • 宮尾 祐介
    東京大学大学院情報理工学系研究科
  • 田中 貴秋
    日本電信電話株式会社 NTT コミュニケーション科学基礎研究所
  • 大村 舞
    人間文化研究機構国立国語研究所
  • 村脇 有吾
    京都大学大学院情報学研究科
  • 松本 裕治
    奈良先端科学技術大学院大学先端科学技術研究科・理化学研究所革新知能統合研究センター

書誌事項

タイトル別名
  • Japanese Universal Dependencies Corpora
  • Universal Dependencies ニホンゴ コーパス

この論文をさがす

抄録

<p>Universal Dependencies (UD) は,共通のアノテーション方式で多言語の構文構造コーパスを言語横断的に開発するプロジェクトである. 2018 年 6 月現在,約 60 の言語で 100 以上のコーパスが開発・公開されており,多言語構文解析器の開発,言語横断的な構文モデルの学習,言語間の類型論的比較などさまざまな研究で利用されている. 本稿では UD の日本語適応について述べる.日本語コーパスを開発する際の問題点として品詞情報・格のラベル・句と節の区別について議論する.また,依存構造木では表現が難しい,並列構造の問題についても議論する.最後に現在までに開発した UD 準拠の日本語コーパスの現状を報告する.</p>

収録刊行物

  • 自然言語処理

    自然言語処理 26 (1), 3-36, 2019-03-15

    一般社団法人 言語処理学会

被引用文献 (3)*注記

もっと見る

参考文献 (9)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ