拡散モデルによるコード追加学習を加えた大規模言語モデル

相馬, 菜生, 高橋, 舞衣, 梶浦, 照乃, 倉光, 君郎

説明

近年，大規模言語モデルは機械翻訳や文書要約などの自然言語処理のみならず，コード生成などソフトウェア開発にも活用されている．また，ソフトウェア工学関連のタスクの品質を高めるため，コードを追加的に学習させる手法が提案されてきた．本研究の目的は，画像生成 AI 分野で広く採用されている拡散モデルのアイディアをコードの追加的な学習に適用し，大規模言語モデルのコード生成の向上を調査することである．我々は，マスクベースと文字ベースの２種類の拡散モデルをコード追加学習用に提案する．本論文では，CodeT5 モデルに提案した拡散モデルを適用した結果，自然言語からのコード生成，コード修正の品質への影響を報告する．

収録刊行物

ソフトウェアエンジニアリングシンポジウム2023論文集

ソフトウェアエンジニアリングシンポジウム2023論文集 2023 128-135, 2023-08-16

情報処理学会

詳細情報詳細情報について

CRID: 1050578669887564416

Web Site: https://ipsj.ixsq.nii.ac.jp/records/227290

本文言語コード: ja

資料種別: conference paper

データソース種別

IRDB

書き出し

問題の指摘

拡散モデルによるコード追加学習を加えた大規模言語モデル

説明

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

詳細情報詳細情報について