金融ドメイン特化のための大規模言語モデルのインストラクションチューニング評価

山田 正嗣, 井本 稔也

doi:10.11517/pjsai.jsai2024.0_3xin253

書誌事項

タイトル別名

Evaluation of Instruction Tuning on Finance-Specific Large Language Models

説明

<p>特定のドメインに特化させた小型言語モデルは汎用的な大規模言語モデルの性能を超えることが報告され始めている．しかしながら，金融領域に特化したオープンソースの言語モデルは限定されており，本領域において十分な性能を持った言語モデルの評価は不十分である．そこで，本研究では，センチメント分析，識別，質問応答といった広範囲な金融領域のタスクを含むベンチマークセットを利用し，小型のチャットモデルを複数の条件でインストラクション・チューニングさせた場合の性能変化について評価を行った．損失関数の比較検証に加え，低ランク適応および量子化を用いてファインチューニング行い7Bモデルと13Bモデルを学習させた結果，継続事前学習や教師有りファインチューニングでは過学習が生じるにもかかわらず，各タスクの精度は向上し，インストラクションのテンプレートに影響を受けることが判明した．</p>

収録刊行物

人工知能学会全国大会論文集

人工知能学会全国大会論文集 JSAI2024 (0), 3Xin253-3Xin253, 2024

一般社団法人人工知能学会

キーワード

詳細情報詳細情報について

CRID: 1390018971042399744

DOI: 10.11517/pjsai.jsai2024.0_3xin253

ISSN: 27587347

本文言語コード: ja

データソース種別

JaLC

抄録ライセンスフラグ: 使用不可

書き出し

問題の指摘