BERT-NERによるテンプレート分類とPatent-Tokenizerを用いた和文特許文章の文章生成

この論文をさがす

抄録

本論文では,弁理士の特許文書作成をサポートするシステムを目指し,特許文書に含まれる頻出文章を自動的に生成する手法を提案する. 従来の汎用文章生成モデルでは特許文書に含まれる多様な未知語を上手にトークン化することができず,適切な文章を生成できないという問題点があった. 本研究では,特許文章に特化し学習させ,特許文章の未知語となる特性に考慮したトークナイザーを導入することで,本問題の解決を図った. 評価実験では,特許文書に含まれる正解文章の一部を入力とし,次文生成を行った.結果として,存在しない単語・フレーズが生成されるという従来手法の問題を提案手法を用いることで改善できることが示された.

収録刊行物

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ