BERT-NERによるテンプレート分類とPatent-Tokenizerを用いた和文特許文章の文章生成
この論文をさがす
抄録
本論文では,弁理士の特許文書作成をサポートするシステムを目指し,特許文書に含まれる頻出文章を自動的に生成する手法を提案する. 従来の汎用文章生成モデルでは特許文書に含まれる多様な未知語を上手にトークン化することができず,適切な文章を生成できないという問題点があった. 本研究では,特許文章に特化し学習させ,特許文章の未知語となる特性に考慮したトークナイザーを導入することで,本問題の解決を図った. 評価実験では,特許文書に含まれる正解文章の一部を入力とし,次文生成を行った.結果として,存在しない単語・フレーズが生成されるという従来手法の問題を提案手法を用いることで改善できることが示された.
収録刊行物
-
- 第85回全国大会講演論文集
-
第85回全国大会講演論文集 2023 (1), 747-748, 2023-02-16
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050016803516946432
-
- NII書誌ID
- AN00349328
-
- Web Site
- http://id.nii.ac.jp/1001/00230050/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB