MEGAZONEブログ
AWS re:Invent 2024 セッションレポート #TNC101|prompt engineeringについて
Introduction to prompt engineering
セッション概要
- タイトル:Introduction to prompt engineering
- 日付:2024年12月2日(月)
- Venue:Mandalay Bay | Level 3 South | South Seas A
- スピーカー:
- rania arinta(technical instructor, Amazon Web service)
- 概要:このセッションでは、さまざまな生成AIモデルのプロンプトを作成して最適化する方法を学びます。まず、このセッションでは、ラージ言語モデル(LLM)と呼ばれるFMのサブセットを含む基本モデル(FM)の基本概念について説明します。次に、プロンプトのさまざまな要素や、プロンプトを効果的に使用するためのいくつかの一般的なベストプラクティスなど、プロンプトエンジニアリングの基本概念について説明します。最後に、このセッションでは、ゼロショット、フューショット、思考の連鎖プロンプトなど、基本的なプロンプト技術に関する情報を提供します。
はじめに
このコラムでは、AWSの「Introduction to Prompt Engineering」セッションを聞き、まとめた内容を共有します。今回のセッションでは、生成型AIとプロンプトエンジニアリングの基本概念、技術活用方法、主要な実践戦略について説明しました。最近、GenAI PoCの進行中に疑問に思ったことがあることがわかりました。申請するようになり、プロンプトの最適化技術、ベストプラクティス、およびさまざまなプロンプト技術(例:Zero-shot、Few-shot、Chain of Thought)について学びたいと思いました。
生成型AIと基礎モデル
生成型AIは、人間の脳を模倣するディープニューラルネットワークを活用して複雑な作業を処理するという。特に、テキストの要約、画像生成、チャットボットの開発などで効果的に活用できますが、基礎モデルは大規模なデータセットを学習し、非地図学習(Self-supervised learning)を通じてコンテキストを把握するという。基礎モデルの主な作業段階は、Pre-training、Fine-tuning、そしてプロンプトエンジニアリングに分かれていますね。
プロンプトエンジニアリングの中心と設計のベストプラクティス
プロンプトエンジニアリングは、入力データを介してモデルの出力を調整する技術です。テキストテキストモデル(大規模言語モデル)とテキストイメージモデルが主なタイプであり、プロンプトは明確で簡潔でなければならず、明確なガイドラインとコンテキストを含めるべきです。たとえば、電子メールの要約を要求する場合は、要約の形式、分量、宛先情報を含めることが重要です。効果的なプロンプト設計のためには、以下の3つの原則を守ることが重要です。
- 明確で簡潔な質問を書く
- 希望の出力形式を指定する
- 必要に応じて例を提供
長い質問ではなく、短く具体的な質問に分ける必要があり、必要に応じてさまざまなモデルをテストして最適な結果を導き出すことができ、サンプルの回答を提供することも有用であると言います。
Zero-shotプロンプトテクニック
Zero-shot技術では、別の例やコンテキストなしで質問を通して答えを導き出すという。この手法は、単純な作業や基本的な情報要求に適しているそうです。たとえば、「今日の天気は?」などの単純な質問がZero-shotプロンプトに対応しているようです。
Few-shotプロンプトテクニック
Few-shot技術では、例とコンテキストを提供してモデルの出力を予想可能にする技術と言います。たとえば、特定の文が肯定的か否定的かを判断する作業で、「この文は否定的」などの例を追加することです。これにより、モデルが作業の文脈をよりよく理解し、精度を高めることができるようになります。
Chain of Thoughtプロンプトテクニック
Chain of Thoughtは複雑な質問に対処するのに役立ちます。 1つの質問をいくつかの小さな段階に分けて作業を進め、各段階の回答を次の段階で活用するというのですが、例えば、自動車購入コスト計算で「1段階:車両価格計算」、「2段階:割賦計算」同じように作業を分けて質問する手法だそうです。
まとめ
今回のセッションでは、生成型AIとプロンプトエンジニアリングの概念、ベストプラクティス、そしてさまざまなプロンプト技術を扱ったセッションでした。
大規模な言語モデルは様々な産業で活用されているということは多くの方々が既に知っているようです。顧客の質問に答えるチャットボット、コード生成を助ける開発ツール(使ってみたら本当にいいですね!)、そしてマーケティングコンテンツを制作する創作ツールとして多く使われているようです。これにより、従業員の生産性を高め、創造的な作業を支援できるという利点があるようです。
明確で簡潔な質問がプロンプトの成功を左右し、各技法の長所を理解し、適切に活用することが重要だというのに、プロンプトエンジニアリングは、生成型AIを効果的に活用するために不可欠な技術のようだという考えをもう一度することになりました。
記事 │MEGAZONECLOUD, Cloud Technology Center(CTC)、Cloud FSI SA 3チーム、チョン・ハフンSA