書誌事項
- タイトル別名
-
- Neural RST-Style Discourse Parsing Exploiting Agreement Sub-trees as Silver Data
抄録
<p>修辞構造解析ではニューラルネットワークなどの識別器を用いた解析器を教師あり学習により学習する.しかし,現存の最大規模のコーパスである RST-DT は 385 文書しかなく,ニューラルネットワークを学習するに十分な量とは言い難い.このような学習データの不足は,クラス数が多く頻度に偏りのある修辞関係ラベルの推定において性能低下の原因となる.そこで,本論文では自動的に修辞構造を付与した疑似正解データセットを利用したニューラル修辞構造解析手法を提案する.疑似正解データセットは複数の解析器により得られた修辞構造木の間で共通する部分木とし,ニューラル修辞構造解析器の事前学習に利用し,人手で作成した正解データを用いて解析器を追加学習する.RST-DT コーパスを用いた実験では,提案手法は OriginalParseval による核性と修辞関係の評価においてそれぞれ micro-F1 で 64.7,54.1 を達成した.</p>
収録刊行物
-
- 自然言語処理
-
自然言語処理 29 (3), 875-900, 2022
一般社団法人 言語処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390856374249912064
-
- ISSN
- 21858314
- 13407619
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- Crossref
- KAKEN
-
- 抄録ライセンスフラグ
- 使用不可