疑似正解データを活用したニューラル修辞構造解析

小林 尚輝, 平尾 努, 上垣外 英剛, 奥村 学, 永田 昌明

doi:10.5715/jnlp.29.875

書誌事項

タイトル別名

Neural RST-Style Discourse Parsing Exploiting Agreement Sub-trees as Silver Data

抄録

<p>修辞構造解析ではニューラルネットワークなどの識別器を用いた解析器を教師あり学習により学習する．しかし，現存の最大規模のコーパスである RST-DT は 385 文書しかなく，ニューラルネットワークを学習するに十分な量とは言い難い．このような学習データの不足は，クラス数が多く頻度に偏りのある修辞関係ラベルの推定において性能低下の原因となる．そこで，本論文では自動的に修辞構造を付与した疑似正解データセットを利用したニューラル修辞構造解析手法を提案する．疑似正解データセットは複数の解析器により得られた修辞構造木の間で共通する部分木とし，ニューラル修辞構造解析器の事前学習に利用し，人手で作成した正解データを用いて解析器を追加学習する．RST-DT コーパスを用いた実験では，提案手法は OriginalParseval による核性と修辞関係の評価においてそれぞれ micro-F1 で 64.7，54.1 を達成した．</p>

収録刊行物

自然言語処理

自然言語処理 29 (3), 875-900, 2022

一般社団法人　言語処理学会

キーワード

詳細情報詳細情報について

CRID: 1390856374249912064

DOI: 10.5715/jnlp.29.875

ISSN: 21858314; 13407619

Web Site: https://www.jstage.jst.go.jp/article/jnlp/29/3/29_875/_pdf

本文言語コード: ja

データソース種別

JaLC
Crossref
KAKEN

抄録ライセンスフラグ: 使用不可

疑似正解データを活用したニューラル修辞構造解析

書誌事項

抄録

収録刊行物

参考文献 (37)*注記

関連プロジェクト

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

疑似正解データを活用したニューラル修辞構造解析

書誌事項

抄録

収録刊行物

参考文献 (37)*注記

関連プロジェクト

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について