言語モデルから生成されたサンプルを選択的に利用する一般化ゼロショットテキスト分類
書誌事項
- タイトル別名
-
- Selective training with generated samples from generative language models for generalized zero-shot text classification
説明
<p>一般化ゼロショットテキスト分類は,教師データが存在しないクラスである未知クラスを含むクラス集合へテキストを分類するタスクであり,ニュースや商品分類などに幅広く応用される.一般化ゼロショットテキスト分類の既存のアプローチとして,未知クラスに対する知識を分類器に獲得させるために,言語モデルを用いて未知クラスのサンプルを擬似的に生成し学習に組み込む手法がある.しかし,この既存手法では,対象ドメイン外も含むデータから獲得した情報をもとに文の生成を行うため,対象ドメインに応じたサンプルのみを生成できず,それにより分類器の学習に悪影響がある.本稿では,分類器にドメイン外のサンプルが入力された時,各クラスへの確率が総じて低くなるという仮定を元に,言語モデルから生成されたサンプル集合からドメイン外のサンプルを削除し,対象ドメインに応じたサンプルのみからなるデータを再構築することで,分類性能を向上させる一般化ゼロショットテキスト分類法を提案する.実データを用いた実験により,ベースラインに対する提案手法の分類性能の改善を示す.</p>
収録刊行物
-
- 人工知能学会全国大会論文集
-
人工知能学会全国大会論文集 JSAI2022 (0), 3C3GS603-3C3GS603, 2022
一般社団法人 人工知能学会