汎用言語モデル学習のためのプロンプト最適化

磯沼 大; 森 純一郎; 坂田 一郎

doi:10.11517/pjsai.JSAI2023.0_1T3GS605

第37回 (2023)

セッションID: 1T3-GS-6-05

DOI https://doi.org/10.11517/pjsai.JSAI2023.0_1T3GS605

会議情報

主催: 一般社団法人人工知能学会

会議名: 2023年度人工知能学会全国大会（第37回）

回次: 37

開催地: 熊本城ホール＋オンライン

開催日: 2023/06/06 - 2023/06/09

汎用言語モデル学習のためのプロンプト最適化

*磯沼大, 森純一郎, 坂田一郎

著者情報

キーワード: 文章生成, メタ学習, 二段階最適化

会議録・要旨集フリー

詳細

抄録

近年、ChatGPTをはじめとした幅広いタスクに汎化できる汎用言語モデルを学習する方法として、タスクごとにプロンプトを付与しマルチタスク学習を行うinstruction tuningが注目されている。これまで様々なプロンプトがinstruction tuningのために作成されているが、どのようなプロンプトがモデルの汎化性能向上に最適なのか明らかになっていない。本研究では学習用プロンプトを二段階最適化により最適化するinstruction optimizationを提案し、instruction tuningに最適なプロンプトを明らかにする。評価実験において、タスクの指示をプロンプトに用いる実験設定（zero-shot）では、二段階最適化によりプロンプトを多様化することが汎化性能向上に有効である一方、タスクの例示をプロンプトに用いる実験設定（few-shot）では、多様な種類の例示ではなく同一の例示を用いる方が有効であることが明らかになった。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）