アバ: これは、Prompt Foundation シリーズの一部であり、さまざまなグループやユースケース向けのさまざまなプロンプト フレームワークを独自に、または専門家と協力して検討します。
これは 再投稿 LinkedIn の Stig の記事より。
導入
前回の記事では 「プロンプトエンジニアリングをマスターする: 技術プロフェッショナルのための 9 つのプロンプトエンジニアリングフレームワークの比較ガイド」では、さまざまな「プロンプト エンジニアリング フレームワーク」におけるプロンプト エンジニアリングで使用されるテクニックと戦略について検討しました。比較分析を行い、これらのフレームワークに関する洞察を提供します。
ここで、AI とのやり取りをさらに強化する重要な側面、ChatGPT のカスタム指示について説明します。この記事の目的は、カスタム指示によって AI の機能を強化し、よりカスタマイズされた効率的なやり取りを実現し、これまでに説明したプロンプト エンジニアリングの原則を補完する重要な役割を果たす方法を明らかにすることです。コミュニケーションの精度が新たな可能性を解き放つ、AI カスタマイズの高度な領域を一緒に探っていきましょう。
AIの応答性のために戦略的に設計された指示:
カスタム指示は、ChatGPT のような AI モデルの出力を形成する上で重要な役割を果たします。これらの指示は、AI が高品質の応答を生成するように導く上で極めて重要です。次に説明する AutoExpert の例では、応答の深さと繊細さを高め、基本的なガイダンスの必要性を最小限に抑え、さらに学習を進めるための関連リンクを提供することに重点が置かれています。
位置エンコーディングとアテンションメカニズムは、AIモデル、特にトランスフォーマーアーキテクチャの重要なコンポーネントであり、自然言語処理やコンピュータービジョンなどのさまざまな分野に革命をもたらしました。これらのコンポーネントは、AIモデルがカスタム指示を処理して応答する方法において重要な役割を果たします。
注意の力
AI モデル、特に GPT (Generative Pre-trained Transformer) などのニューラル ネットワークのコンテキストにおける「アテンション」とは、予測を行ったり出力を生成したりするときに、モデルが入力データのさまざまな部分に焦点を当てることができるメカニズムです。この概念は、情報の関連性がコンテキストに応じて変化する可能性がある言語処理などの連続データを含むタスクを処理するために重要です。
アナロジー: カクテルパーティー効果
AI モデルにおける注意を理解するための良い例えは、人間の聴覚と注意における「カクテル パーティー効果」です。多くの人が同時に話しているにぎやかなカクテル パーティーにいると想像してください。騒々しい環境にもかかわらず、聴覚を 1 つの会話に集中させ、他の声や背景の雑音を効果的に遮断することができます。この選択的注意により、集中している会話を理解し、適切に対応することができます。
同様に、注意メカニズムを備えた AI モデルでは、
- 選択フォーカス: 騒がしい部屋で特定の会話に集中するのと同じように、モデルは、手元のタスクに関連性の高い入力データの特定の部分に選択的に焦点を合わせます。たとえば、文を生成するときに、モデルは文法の一貫性を確保するために文の主語にさらに注意を払う場合があります。
- コンテキスト認識: パーティーでの会話の理解は、話されている言葉と文脈(誰が話しているか、会話のトピックなど)の両方に依存します。同様に、AI モデルにおける注意により、入力データのさまざまな部分の重要性を適切な文脈で評価できます。
- ダイナミック調整t: パーティーでの会話が変化したり、別の会話に切り替えたりすると、それに応じて焦点と理解が調整されます。AI モデルでは、注意は静的ではなく、入力データのシーケンスとモデルが現在処理している内容に応じて動的に変化します。
要約すると、AI モデルにおける注意は、騒がしいパーティーでの 1 つの会話に集中するようなものです。つまり、モデルは、より広いコンテキストを考慮し、必要に応じて動的に調整しながら、特定の時点で最も関連性の高い情報に集中できます。これにより、特に言語処理などの複雑なタスクでは、より正確でコンテキストに適した出力が得られます。
位置エンコーディングの重要性
AI モデルにおける位置エンコーディングは、特に自然言語処理に使用されるトランスフォーマーなどのモデルのコンテキストでは、シーケンス内のトークン (単語など) の位置に関する情報を挿入する方法です。モデルは言語を理解するために単語が何であるかだけでなく、文中の単語の順序も理解する必要があるため、これは重要です。
類推: 歌の中の音符
音符の順序がメロディーとリズムにとって非常に重要な曲を想像してください。各音符は、独自のサウンド (文中の単語のように) を持っているだけでなく、曲の順序における特定の位置 (文中の単語の位置のように) も持っています。順序を考慮せずに音符を演奏すると、メロディーが失われます。これは、語順を考慮しないと文の意味が失われるのと同じです。
このアナロジーで、位置エンコーディングは、各音符に付けられ、曲の中での位置を示すラベルのようなものです。このラベルは、誰か(または AI の場合はモデル)が音符自体を理解するだけでなく、曲全体の流れの中で音符がどこに当てはまるかを理解するのに役立ちます。この位置情報がなければ、すべての音符(または単語)は同じように重要で互いに独立しているように見え、メロディー(または文の構造)を認識することが難しくなります。
ミュージシャンが音符とその位置の両方を読み取って一貫した曲を演奏するのと同じように、AI モデルは単語情報とその位置のエンコードの両方を使用して、一貫した言語を理解して生成します。
カスタム命令処理
応答の詳細な形式を指定すると、AI モデルは位置エンコーディングを使用して、これらの指示の順序と構造を理解します。同時に、アテンション メカニズムは指示のさまざまな側面 (詳細度、フォーマット要件など) に選択的に焦点を合わせ、指定した設定に一致する応答を生成します。
試してみましょう
まず、カスタム指示のないベースラインの例を示します。
ここで、カスタム指示をいくつか追加します。
AutoExpert v3フレームワークでカスタム指示を設定する方法
ChatGPTにサインイン
画面左下のプロフィールボタンを選択して設定メニューを開きます
カスタム指示を選択
最初のテキストボックスに次のテキストをコピーして「About Me」セクションに貼り付けます。
# 自己紹介 - (ここでは名前/年齢/居住地/職業を記入していますが、必要に応じてこのヘッダー全体を省略できます。) - (各行の前に必ず - (ダッシュ、スペース) を使用してください。ただし、1~2 行にしてください) # アシスタントに対する私の期待 ユーザーがこれらの期待を無視する場合は、そのユーザーの希望に従います。 ## 言語とトーン - 特定のコンテキストに適した専門用語を使用します - 避けるべきこと: 余分な散文、自己言及、専門家のアドバイスの免責事項、謝罪 ## コンテンツの深さと幅 - トピックの全体的な理解を示します - 包括的でニュアンスに富んだ分析とガイダンスを提供します - 複雑なクエリについては、ステップバイステップの説明で推論プロセスを示します ## コンテンツの深さと幅 - トピックの全体的な理解を示します - 包括的でニュアンスに富んだ分析とガイダンスを提供します - 複雑なクエリについては、ステップバイステップの説明で推論プロセスを示しますステップバイステップの説明 ## 方法論とアプローチ - 必要に応じて、ソクラテス式の自己質問と心の理論を模倣します - コードサンプル内のコードを省略または切り捨てないでください ## 出力の書式設定 - マークダウン、絵文字、Unicode、リストとインデント、見出し、表は、構成、読みやすさ、理解を向上させるためだけに使用します - 重要: すべてのハイパーリンクを Google 検索リンクとしてインラインで埋め込みます {用語に関連する絵文字} 短いテキスト - 特に、Google 検索を使用して、論文、記事、書籍、組織、人物、法的引用、技術用語、業界標準などのエンティティにハイパーリンクを追加します
2番目のテキストボックスに次のテキストをコピーして貼り付けます
詳細度: 回答の詳細を設定するために、V=[0-5] を使用します。 - V=0 1 行 - V=1 簡潔 - V=2 簡潔 - V=3 標準 - V=4 例を挙げて詳細 - V=5 包括的 (長さ、詳細度、ニュアンスを可能な限り多く) 1. 回答は次から始めます。 |属性|説明| |--:|:--| |ドメイン > エキスパート|{質問が属する広範な学術または研究ドメイン} > {ドメイン内で、質問のコンテキストやニュアンスに最も関連のある特定のエキスパート ロール}| |キーワード|{ドメイン、エキスパートに最も関連のある 6 つのトピック、技術用語、または専門用語の CSV リスト}| |目標|{現在のアシスタントの目的と詳細度の定性的な説明}| |仮定|{ユーザーの質問、意図、およびコンテキストに関するアシスタントの仮定}| |方法論|{アシスタントが組み込む特定の方法論}| 2. 回答を返信します。その際、次の点を忘れずに組み込んでください。 - アシスタントのルールと出力形式 - Google 検索リンクとして埋め込まれたインライン ハイパーリンク {用語に関連するさまざまな絵文字} 必要に応じてリンクするテキスト - 必要に応じて段階的な推論 3. 回答を次のように終了します。 > 参照: [2~3 件の関連検索] > {用語に関連するさまざまな絵文字} リンクするテキスト > 次もご覧ください: [2~3 件の関連トピック、珍しいトピック、または楽しいトピック] > {用語に関連するさまざまな絵文字} [リンクするテキスト](https://www.google.com/search?q=expanded+search+terms)
上記のカスタム手順のアイデアはredditからのもので、v3の元の投稿はここにあります(スプダスティン)
新しいバージョンもご用意しております バージョン v5
ここで出力をV=2(短い)に設定し、前と同じ入力を与えると、次のようになります。
より包括的な回答が必要な場合は、V = 5(包括的)に設定します。
出力をさらに変更したい場合は、さらに情報を追加できます。上記のコード例はすべてPythonでしたが、代わりにJavaをデフォルトにしたいので、##の方法論とアプローチのセクションに次のコードを追加します。
- Java でコードを作成し、イベント駆動型アーキテクチャと SOLID 原則に従ったコードを好みます。
同じ入力を実行します:
そして、出力は Java で表示されます。
可能性は無限です。ぜひ試して、実験してみてください。
上記の例では、AutoExpert v3 フレームワークの指示を使用していますが、必ずしもこれを使用する必要はありません。
必要な入力を何でも入力できます。
カスタム指示に関するその他のアイデアについては、 こちら(私の記事ではありません)
結論
この記事で詳しく説明されているように、特に ChatGPT のコンテキストでの AI 向けカスタム指示の調査は、AI インタラクションとユーザー エクスペリエンスの分野における大きな進歩を示しています。戦略的なカスタム指示を統合することで、AI システムとのよりパーソナライズされ、効率的で、コンテキストを認識したインタラクションの可能性が広がります。
この記事の主要な洞察は、ChatGPT などの AI モデル内の注意メカニズムと位置エンコーディングが、これらの指示の処理にどのように役立つかを明らかにしています。この機能により、これまで達成できなかったレベルの応答性と特異性が可能になり、AI とのやり取りに対するユーザーの制御が向上します。
さらに、AutoExpert v3 フレームワークを通じてこれらの概念を実際に適用することで、カスタム命令の実際の適用性と利点が実証されます。
本質的に、この記事は AI におけるカスタム指示の変革力を強調し、より繊細でカスタマイズされた AI エクスペリエンスへの入り口を提供します。私たちが AI テクノロジーの革新と限界の押し上げを続けるにつれて、カスタム指示の役割は間違いなく AI とユーザーのインタラクションの未来を形作る上でますます中心的なものになるでしょう。
著者について
人工知能の世界における最新のトレンドやイノベーションを探求するのが大好きな、テクノロジー愛好家で AI 愛好家の Stig Korsholm 氏をご紹介します。Stig 氏は現在、Bankdata の主任ドメイン アーキテクトを務めており、金融および銀行分野のテクノロジーで豊富な経験を持っています。
ゲスト著者として、スティグは独自の洞察と経験を共有し、複雑なトピックを誰もが理解しやすく魅力的なものにしています。テクノロジーと実際のアプリケーションを融合させる才能を持つスティグは、企業が AI の力を活用して成功を促進できるよう支援することに熱心に取り組んでいます。
執筆や新技術の探求をしていないときは、イノベーター仲間と交流したり、刺激的なアイデアを共有したりしています。
LinkedInで彼とつながる→ ここ!
最新のブログ投稿の更新情報を受け取るには購読してください
コメントを残す: