A.B.A.: Cela fait partie de notre série Prompt Foundation, dans laquelle nous explorons différents cadres d'invite pour différents groupes et cas d'utilisation, seuls et avec des experts.
C'est un republier de l'article de Stig sur LinkedIn.
Introduction
Dans mon article précédent « Maîtriser l’ingénierie rapide : un guide comparatif de neuf cadres d’ingénierie rapide pour les professionnels de la technologie »J'ai étudié les techniques et stratégies utilisées dans l'ingénierie rapide dans différents « cadres d'ingénierie rapide ». Il fournit une analyse comparative, offrant un aperçu de ces cadres.
Je me tourne maintenant vers un aspect essentiel qui renforce encore davantage nos interactions avec l’IA : les instructions personnalisées pour ChatGPT. Cet article vise à comprendre comment les instructions personnalisées peuvent améliorer les capacités de l’IA, en offrant une interaction plus personnalisée et plus efficace, et ainsi servir de complément essentiel aux principes d’ingénierie rapide évoqués précédemment. Rejoignez-moi pour plonger dans ce domaine avancé de la personnalisation de l’IA, où la précision de la communication ouvre de nouveaux potentiels.
Instructions conçues stratégiquement pour la réactivité de l'IA :
Les instructions personnalisées jouent un rôle crucial dans la définition des résultats des modèles d'IA comme ChatGPT. Ces instructions peuvent être essentielles pour guider l'IA afin de produire des réponses de haut calibre. Dans l'exemple d'AutoExpert que nous allons examiner ensuite, la conception se concentre sur l'amélioration de la profondeur et de la subtilité des réponses, en minimisant le besoin de conseils de base et en fournissant des liens pertinents pour des activités pédagogiques ultérieures.
Les mécanismes d'encodage positionnel et d'attention sont des composants essentiels des modèles d'IA, en particulier des architectures de transformateurs, qui ont révolutionné divers domaines comme le traitement du langage naturel et la vision par ordinateur. Ces composants jouent un rôle important dans la manière dont les modèles d'IA traitent et répondent aux instructions personnalisées
Le pouvoir de l'attention
Dans les modèles d’IA, notamment dans le contexte des réseaux neuronaux comme GPT (Generative Pre-trained Transformer), l’« attention » est un mécanisme qui permet au modèle de se concentrer sur différentes parties des données d’entrée lors de la réalisation de prédictions ou de la génération de résultats. Ce concept est essentiel pour gérer des tâches impliquant des données séquentielles, comme le traitement du langage, où la pertinence des informations peut varier en fonction du contexte.
Analogie : l'effet cocktail
Une bonne analogie pour comprendre l’attention dans les modèles d’IA est l’« effet cocktail » sur l’audition et l’attention humaines. Imaginez que vous êtes à un cocktail animé avec de nombreuses personnes qui parlent simultanément. Malgré l’environnement bruyant, vous pouvez concentrer votre audition sur une seule conversation, en ignorant efficacement les autres voix et le bruit de fond. Cette attention sélective vous permet de comprendre et de répondre de manière appropriée à la conversation sur laquelle vous vous concentrez.
De même, dans les modèles d’IA dotés de mécanismes d’attention :
- Mise au point sélective:De la même manière que vous vous concentrez sur une conversation spécifique dans une pièce bruyante, le modèle se concentre de manière sélective sur certaines parties des données d'entrée qui sont plus pertinentes pour la tâche à accomplir. Par exemple, lors de la génération d'une phrase, le modèle peut accorder plus d'attention au sujet de la phrase pour garantir la cohérence grammaticale.
- Connaissance du contexte:La compréhension d'une conversation lors d'une soirée dépend à la fois des mots prononcés et du contexte (comme la personne qui parle, le sujet de la conversation, etc.). De la même manière, l'attention dans les modèles d'IA leur permet d'évaluer l'importance des différentes parties des données d'entrée dans leur contexte approprié.
- Ajusteurs dynamiquest : Au fur et à mesure que la conversation change ou que vous passez à une autre conversation, votre concentration et votre compréhension s'ajustent en conséquence. Dans les modèles d'IA, l'attention n'est pas statique ; elle change de manière dynamique en fonction de la séquence des données d'entrée et de ce que le modèle est en train de traiter.
En résumé, l’attention dans les modèles d’IA est comparable à la concentration sur une seule conversation lors d’une soirée bruyante : elle permet au modèle de se concentrer sur les informations les plus pertinentes à un moment donné, en tenant compte du contexte plus large et en s’adaptant de manière dynamique selon les besoins. Cela conduit à des résultats plus précis et plus adaptés au contexte, en particulier dans des tâches complexes comme le traitement du langage.
L'importance du codage positionnel
L'encodage positionnel dans les modèles d'IA, notamment dans le contexte de modèles comme Transformers utilisés pour le traitement du langage naturel, est une méthode permettant d'injecter des informations sur la position des tokens (des mots, par exemple) au sein d'une séquence. Cela est important car le modèle doit comprendre non seulement ce que sont les mots, mais aussi leur ordre dans une phrase pour donner un sens au langage.
Analogie : Notes de musique dans une chanson
Imaginez une chanson dans laquelle la séquence des notes de musique est cruciale pour sa mélodie et son rythme. Chaque note a non seulement un son unique (comme un mot dans une phrase) mais aussi une position spécifique dans la séquence de la chanson (comme la position d'un mot dans une phrase). Si vous deviez simplement jouer les notes sans tenir compte de leur ordre, la mélodie serait perdue, de la même manière que le sens d'une phrase peut être perdu si l'ordre des mots n'est pas pris en compte.
Dans cette analogie, le codage positionnel est comme une étiquette attachée à chaque note qui indique sa position dans la chanson. Cette étiquette aide quelqu'un (ou dans le cas de l'IA, le modèle) à comprendre non seulement la note elle-même, mais aussi sa place dans la séquence globale de la chanson. Sans ces informations de position, toutes les notes (ou mots) sembleraient tout aussi importantes et indépendantes les unes des autres, ce qui rendrait difficile la perception de la mélodie (ou de la structure de la phrase).
Tout comme un musicien lit à la fois les notes et leurs positions pour jouer un morceau cohérent, le modèle d’IA utilise à la fois les informations des mots et leurs codages positionnels pour comprendre et générer un langage cohérent.
Traitement des instructions personnalisées
Lorsque nous fournissons un format détaillé pour les réponses, le modèle d'IA utilise un codage positionnel pour comprendre l'ordre et la structure de ces instructions. Parallèlement, le mécanisme d'attention se concentre de manière sélective sur différents aspects des instructions (comme la verbosité, les exigences de formatage) pour générer une réponse qui correspond à nos préférences spécifiées.
Essayons-le
Je vais d’abord fournir un exemple de base sans les instructions personnalisées :
Je vais maintenant ajouter quelques instructions personnalisées :
Comment configurer des instructions personnalisées avec le framework AutoExpert v3
Connectez-vous à ChatGPT
Sélectionnez le bouton de profil en bas à gauche de l'écran pour ouvrir le menu des paramètres
Sélectionnez les instructions personnalisées
Dans la première zone de texte, copiez et collez le texte suivant dans la section « À propos de moi »
# À propos de moi - (J'ai mis le nom/âge/lieu/profession ici, mais vous pouvez supprimer tout cet en-tête si vous le souhaitez.) - (assurez-vous d'utiliser - (tiret, puis espace) avant chaque ligne, mais tenez-vous-en à 1-2 lignes) # Mes attentes envers l'assistant Respectez les souhaits de l'utilisateur s'il outrepasse ces attentes : ## Langage et ton - Utilisez la terminologie EXPERT pour le contexte donné - ÉVITEZ : la prose superflue, les auto-références, les avis de non-responsabilité concernant les conseils d'experts et les excuses ## Profondeur et étendue du contenu - Présentez une compréhension globale du sujet - Fournissez une analyse et des conseils complets et nuancés - Pour les requêtes complexes, démontrez votre processus de raisonnement avec des explications étape par étape ## Profondeur et étendue du contenu - Présentez une compréhension globale du sujet - Fournissez une analyse et des conseils complets et nuancés - Pour les requêtes complexes, démontrez votre processus de raisonnement avec des explications étape par étape ## Méthodologie et approche - Imitez l'auto-questionnement socratique et la théorie de l'esprit selon les besoins - Ne pas élider ou tronquer le code dans les exemples de code ## Formatage de la sortie - Utilisez Markdown, emoji, Unicode, listes et retraits, titres et tableaux uniquement pour améliorer l'organisation, la lisibilité et la compréhension - CRITIQUE : Intégrez tous les LIENS HYPERTEXTES en ligne sous forme de liens de recherche Google {emoji liés aux termes} texte court - Ajoutez en particulier des LIENS HYPERTEXTES vers des entités telles que des articles, des livres, des organisations, des personnes, des citations juridiques, des termes techniques et des normes industrielles à l'aide de la recherche Google
Dans la deuxième zone de texte, copiez et collez le texte suivant
VERBOSITÉ : Je peux utiliser V=[0-5] pour définir les détails de la réponse : - V=0 une ligne - V=1 concis - V=2 bref - V=3 normal - V=4 détaillé avec des exemples - V=5 complet, avec autant de longueur, de détails et de nuances que possible 1. Commencez la réponse par : |Attribut|Description| |--:|:--| |Domaine > Expert|{le vaste DOMAINE universitaire ou d'étude dont relève la question} > {dans le DOMAINE, le rôle spécifique d'EXPERT le plus étroitement associé au contexte ou à la nuance de la question}| |Mots-clés|{liste CSV de 6 sujets, termes techniques ou jargon les plus associés au DOMAINE, EXPERT}| |Objectif|{description qualitative de l'objectif actuel de l'assistant et VERBOSITÉ}| |Hypothèses|{hypothèses de l'assistant sur la question de l'utilisateur, l'intention et le contexte}| |Méthodologie|{toute méthodologie spécifique que l'assistant incorporera}| 2. Renvoyez votre réponse et n'oubliez pas d'incorporer : - Règles de l'assistant et format de sortie - des HYPERLIENS intégrés en ligne comme liens de recherche Google { emoji variés liés aux termes} texte à lier selon les besoins - raisonnement étape par étape si nécessaire 3. Terminez la réponse par : > Voir aussi : [2-3 recherches associées] > { emoji variés liés aux termes} texte à lier > Vous pourriez également apprécier : [2-3 sujets connexes tangentiels, inhabituels ou amusants] > { emoji variés liés aux termes} [texte à lier](https://www.google.com/search?q=expanded+search+terms)
L'idée des instructions personnalisées ci-dessus provient de Reddit, et le message original pour la v3 peut être trouvé ici (spdustin)
Également disponible dans une version plus récente version v5
Si je règle maintenant la sortie sur V=2 (bref) et donne la même entrée qu'avant, j'obtiens ce qui suit
Si je veux une réponse plus complète, je mets V=5 (complet)
Si je souhaite modifier davantage le résultat, je peux ajouter des informations supplémentaires. Tous les exemples de code ci-dessus étaient en Python, mais je souhaite utiliser Java par défaut à la place, j'ajoute donc simplement ce qui suit dans la section Méthodologie et approche ##
- codes en Java, et je préfère le code qui suit les principes Event Driven Architecture et SOLID.
Exécutez la même entrée :
Et maintenant, la sortie est en Java.
Les possibilités sont infinies, essayez-les, expérimentez-les.
Les exemples ci-dessus utilisent les instructions du framework AutoExpert v3, mais vous n'êtes pas obligé de les utiliser.
Vous pouvez donner toutes les informations que vous souhaitez.
D'autres idées d'instructions personnalisées peuvent être trouvées ici (pas mon article)
Conclusion
L’exploration des instructions personnalisées pour l’IA, notamment dans le contexte de ChatGPT, comme détaillé dans cet article, marque une avancée significative dans le domaine de l’interaction et de l’expérience utilisateur de l’IA. En intégrant des instructions personnalisées stratégiques, nous libérons le potentiel d’interactions plus personnalisées, plus efficaces et plus sensibles au contexte avec les systèmes d’IA.
Les principales conclusions de l'article révèlent comment les mécanismes d'attention et l'encodage positionnel au sein des modèles d'IA, tels que ChatGPT, jouent un rôle déterminant dans le traitement de ces instructions. Cette capacité permet un niveau de réactivité et de spécificité jusqu'alors inaccessible, augmentant ainsi le contrôle de l'utilisateur sur les interactions de l'IA.
De plus, l’application pratique de ces concepts via le framework AutoExpert v3 démontre l’applicabilité et les avantages réels des instructions personnalisées.
En substance, cet article met en évidence le pouvoir transformateur des instructions personnalisées en IA, offrant une passerelle vers des expériences d’IA plus nuancées et personnalisées. À mesure que nous continuons d’innover et de repousser les limites de la technologie de l’IA, le rôle des instructions personnalisées deviendra sans aucun doute de plus en plus central dans l’élaboration de l’avenir des interactions entre l’IA et les utilisateurs.
À propos de l'auteur
Rencontrez Stig Korsholm, un passionné de technologie et d'IA qui adore se plonger dans les dernières tendances et innovations dans le monde de l'intelligence artificielle. Stig est actuellement architecte principal de domaine chez Bankdata et possède une vaste expérience en technologie dans le domaine financier et bancaire.
En tant qu'auteur invité, Stig partage ses idées et ses expériences uniques, rendant des sujets complexes accessibles et intéressants pour tous. Doté d'un talent pour combiner la technologie avec des applications concrètes, il est passionné par l'aide aux entreprises pour exploiter la puissance de l'IA pour favoriser la réussite.
Lorsqu'il n'écrit pas ou n'explore pas de nouvelles technologies, vous pouvez le trouver en train de se connecter avec d'autres innovateurs et de partager des idées qui inspirent.
Connectez-vous avec lui sur LinkedIn → ici!
Abonnez-vous pour recevoir les dernières mises à jour du blog
Laissez votre commentaire: