![](https://www.aibusinessasia.com/wp-content/uploads/2024/11/Copy_of_World.avif)
Abadía: Esta es parte de nuestra serie Prompt Foundation, donde exploramos varios marcos de trabajo rápidos para diferentes grupos y casos de uso, por nuestra cuenta y con expertos.
Este es un volver a publicar del artículo de Stig en LinkedIn.
Introducción
En mi artículo anterior “Dominar la ingeniería de avisos: una guía comparativa de nueve marcos de ingeniería de avisos para profesionales de la tecnología”Analicé las técnicas y estrategias utilizadas en la ingeniería rápida en diferentes “marcos de ingeniería rápida”. El artículo ofrece un análisis comparativo que ofrece información sobre estos marcos.
Ahora me referiré a un aspecto fundamental que potencia aún más nuestras interacciones con la IA: las instrucciones personalizadas para ChatGPT. Este artículo tiene como objetivo desentrañar cómo las instrucciones personalizadas pueden mejorar las capacidades de la IA, ofreciendo una interacción más personalizada y eficiente y, por lo tanto, servir como un complemento vital para los principios de ingeniería rápida que se analizaron anteriormente. Únase a mí para profundizar en este ámbito avanzado de personalización de la IA, donde la precisión en la comunicación libera nuevos potenciales.
Instrucciones diseñadas estratégicamente para la capacidad de respuesta de la IA:
Las instrucciones personalizadas desempeñan un papel crucial en la configuración del resultado de los modelos de IA como ChatGPT. Estas instrucciones pueden ser fundamentales para guiar a la IA a fin de que produzca respuestas de alto calibre. En el ejemplo de AutoExpert que veremos a continuación, el diseño se centra en mejorar la profundidad y la sutileza de las respuestas, minimizar la necesidad de una guía básica y proporcionar enlaces relevantes para futuras actividades educativas.
La codificación posicional y los mecanismos de atención son componentes críticos en los modelos de IA, especialmente en las arquitecturas de transformadores, que han revolucionado diversos campos como el procesamiento del lenguaje natural y la visión artificial. Estos componentes desempeñan un papel importante en la forma en que los modelos de IA procesan y responden a las instrucciones personalizadas.
El poder de la atención
La “atención” en los modelos de IA, en particular en el contexto de redes neuronales como GPT (Transformador preentrenado generativo), es un mecanismo que permite que el modelo se centre en diferentes partes de los datos de entrada al realizar predicciones o generar resultados. Este concepto es crucial para gestionar tareas que involucran datos secuenciales, como el procesamiento del lenguaje, donde la relevancia de la información puede variar según el contexto.
Analogía: El efecto del cóctel
Una buena analogía para entender la atención en los modelos de IA es el “efecto cóctel” en la audición y la atención humanas. Imagina que estás en una fiesta concurrida con muchas personas hablando al mismo tiempo. A pesar del ambiente ruidoso, puedes concentrar tu audición en una sola conversación, ignorando de manera efectiva otras voces y el ruido de fondo. Esta atención selectiva te permite comprender y responder adecuadamente a la conversación en la que estás concentrado.
De manera similar, en los modelos de IA con mecanismos de atención:
- Enfoque selectivo:De la misma manera que usted se concentra en una conversación específica en una sala ruidosa, el modelo se concentra selectivamente en ciertas partes de los datos de entrada que son más relevantes para la tarea en cuestión. Por ejemplo, al generar una oración, el modelo podría prestar más atención al sujeto de la oración para garantizar la coherencia gramatical.
- Conciencia del contexto:Tu comprensión de una conversación en una fiesta depende tanto de las palabras que se dicen como del contexto (por ejemplo, quién está hablando, el tema de la conversación, etc.). De la misma manera, la atención en los modelos de IA les permite sopesar la importancia de diferentes partes de los datos de entrada en su contexto adecuado.
- Ajuste dinámicot: A medida que la conversación en la fiesta cambia o cuando cambias de tema, tu atención y comprensión se ajustan en consecuencia. En los modelos de IA, la atención no es estática, sino que cambia dinámicamente según la secuencia de datos de entrada y lo que el modelo esté procesando en ese momento.
En resumen, la atención en los modelos de IA es como concentrarse en una sola conversación en una fiesta ruidosa: permite que el modelo se concentre en la información más relevante en un momento dado, teniendo en cuenta el contexto más amplio y ajustándose dinámicamente según sea necesario. Esto conduce a resultados más precisos y contextualmente apropiados, especialmente en tareas complejas como el procesamiento del lenguaje.
La importancia de la codificación posicional
La codificación posicional en los modelos de IA, en particular en el contexto de modelos como Transformers utilizados para el procesamiento del lenguaje natural, es un método para inyectar información sobre la posición de los elementos (palabras, por ejemplo) dentro de una secuencia. Esto es importante porque el modelo necesita comprender no solo cuáles son las palabras, sino también su orden en una oración para entender el lenguaje.
Analogía: Notas musicales en una canción
Imagina una canción en la que la secuencia de notas musicales es crucial para su melodía y ritmo. Cada nota no solo tiene su sonido único (como una palabra en una oración), sino también una posición específica en la secuencia de la canción (como la posición de una palabra en una oración). Si tocases las notas sin tener en cuenta su orden, la melodía se perdería, de forma similar a cómo se puede perder el significado de una oración si no se tiene en cuenta el orden de las palabras.
En esta analogía, la codificación posicional es como una etiqueta pegada a cada nota que indica su posición en la canción. Esta etiqueta ayuda a alguien (o en el caso de la IA, al modelo) a comprender no solo la nota en sí, sino también dónde encaja en la secuencia general de la canción. Sin esta información posicional, todas las notas (o palabras) parecerían igualmente importantes e independientes entre sí, lo que dificultaría la percepción de la melodía (o la estructura de la oración).
Así como un músico lee las notas y sus posiciones para tocar una pieza coherente, el modelo de IA utiliza tanto la información de las palabras como sus codificaciones posicionales para comprender y generar un lenguaje coherente.
Procesamiento de instrucciones personalizadas
Cuando proporcionamos un formato detallado para las respuestas, el modelo de IA utiliza la codificación posicional para comprender el orden y la estructura de estas instrucciones. Al mismo tiempo, el mecanismo de atención se centra selectivamente en diferentes aspectos de las instrucciones (como la verbosidad y los requisitos de formato) para generar una respuesta que se ajuste a nuestras preferencias específicas.
Vamos a probarlo
Primero proporcionaré un ejemplo base sin las instrucciones personalizadas:
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/4d5fe421-6716-42c3-a833-b2fe2397f8b8/image.png?t=1724035784)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/aba9c002-1bb3-4a90-970d-23dd0d9ef2be/image.png?t=1724753070)
Ahora agregaré algunas instrucciones personalizadas:
Cómo configurar instrucciones personalizadas con el framework AutoExpert v3
Iniciar sesión en ChatGPT
Seleccione el botón de perfil en la parte inferior izquierda de la pantalla para abrir el menú de configuración.
Seleccione instrucciones personalizadas
En el primer cuadro de texto, copie y pegue el siguiente texto en la sección “Acerca de mí”
# Acerca de mí - (Pongo nombre/edad/ubicación/ocupación aquí, pero puedes omitir todo este encabezado si lo deseas) - (asegúrate de usar - (guión, luego espacio) antes de cada línea, pero apégate a 1-2 líneas) # Mis expectativas del asistente Respeta los deseos del usuario si anulan estas expectativas: ## Lenguaje y tono - Usa terminología EXPERTA para el contexto dado - EVITA: prosa superflua, autorreferencias, descargos de responsabilidad de consejos de expertos y disculpas ## Profundidad y amplitud del contenido - Presenta una comprensión holística del tema - Proporciona un análisis y una guía completos y matizados - Para consultas complejas, demuestra tu proceso de razonamiento con explicaciones paso a paso ## Profundidad y amplitud del contenido - Presenta una comprensión holística del tema - Proporciona un análisis y una guía completos y matizados - Para consultas complejas, demuestra tu proceso de razonamiento con explicaciones paso a paso ## Metodología y enfoque: imitar el autocuestionamiento socrático y la teoría de la mente según sea necesario. No omitir ni truncar el código en los ejemplos de código. ## Formato de salida: usar Markdown, emoji, Unicode, listas y sangrías, encabezados y tablas solo para mejorar la organización, la legibilidad y la comprensión. CRÍTICO: incorporar todos los HIPERVÍNCULOS en línea como enlaces de búsqueda de Google {emoji relacionado con términos} texto corto. Agregar HIPERVÍNCULOS especialmente a entidades como documentos, artículos, libros, organizaciones, personas, citas legales, términos técnicos y estándares de la industria mediante la Búsqueda de Google.
En el segundo cuadro de texto, copie y pegue el siguiente texto
VERBOSIDAD: Puedo usar V=[0-5] para establecer los detalles de la respuesta: - V=0 una línea - V=1 concisa - V=2 breve - V=3 normal - V=4 detallada con ejemplos - V=5 completa, con tanta extensión, detalle y matices como sea posible 1. Iniciar la respuesta con: |Atributo|Descripción| |--:|:--| |Dominio > Experto|{el DOMINIO académico o de estudio amplio bajo el cual cae la pregunta} > {dentro del DOMINIO, el rol específico de EXPERTO más estrechamente asociado con el contexto o matiz de la pregunta}| |Palabras clave|{Lista CSV de 6 temas, términos técnicos o jerga más asociados con el DOMINIO, EXPERTO}| |Objetivo|{descripción cualitativa del objetivo actual del asistente y VERBOSIDAD}| |Supuestos|{supuestos del asistente sobre la pregunta, intención y contexto del usuario}| |Metodología|{cualquier metodología específica que el asistente incorporará}| 2. Devuelve tu respuesta y recuerda incorporar: - Reglas del Asistente y Formato de Salida - HIPERVÍNCULOS integrados en línea como enlaces de búsqueda de Google { emoji variados relacionados con los términos} texto para vincular según sea necesario - razonamiento paso a paso si es necesario 3. Termina la respuesta con: > Ver también: [2-3 búsquedas relacionadas] > { emoji variados relacionados con los términos} texto para vincular > También te puede interesar: [2-3 temas relacionados tangenciales, inusuales o divertidos] > { emoji variados relacionados con los términos} [texto para vincular](https://www.google.com/search?q=expanded+search+terms)
La idea de las instrucciones personalizadas anteriores proviene de Reddit, y la publicación original para la versión 3 se puede encontrar aquí (polvo de espiga)
También disponible en una versión más nueva. versión v5
Si ahora establezco la salida en V=2 (breve) y doy la misma entrada que antes, obtengo lo siguiente
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/9eb0096e-6454-486d-b622-3a9d02606545/image.png?t=1724764414)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/e2ea65fd-9a6b-44dd-843d-11203354e133/image.png?t=1724764433)
Si quiero una respuesta más completa, establezco V=5 (completa)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/3c6694dc-e635-44a2-89b0-61b723c92456/image.png?t=1724764492)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/e4b31306-da8d-435e-b438-356d03880ee1/image.png?t=1724764499)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/07662110-b70c-45ea-8552-67886f377194/image.png?t=1724764504)
Si quiero cambiar más el resultado, puedo agregar más información. Todos los ejemplos de código anteriores estaban en Python, pero quiero que Java sea el valor predeterminado, así que simplemente agrego lo siguiente en la sección Metodología y enfoque de ##
- códigos en Java, y prefiero el código que sigue la arquitectura basada en eventos y los principios SOLID.
Ejecute la misma entrada:
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/8382731d-9334-4bea-9669-e5506212f844/image.png?t=1724764544)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/f810a876-657c-4436-b666-d2ecd34511ee/image.png?t=1724764553)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/9ba5a06d-7edb-44a4-99d7-3a9feafba4b2/image.png?t=1724764557)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/07bcc9ab-3549-4203-ae2e-5138ed5f9858/image.png?t=1724764563)
Y ahora la salida está en Java.
Las posibilidades son infinitas, pruébalo, experimenta con ello.
Los ejemplos anteriores utilizan las instrucciones del marco AutoExpert v3, pero no es necesario utilizarlas.
Puedes aportar cualquier opinión que quieras.
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/092da828-f710-4986-83da-f787c8e393e3/image.png?t=1724764603)
![](https://media.beehiiv.com/cdn-cgi/image/fit=scale-down,format=auto,onerror=redirect,quality=80/uploads/asset/file/71abdd75-c208-42dd-826c-b43a151362ba/image.png?t=1724764611)
Se pueden encontrar otras ideas para instrucciones personalizadas. Aquí (no es mi artículo)
Conclusión
La exploración de instrucciones personalizadas para IA, en particular en el contexto de ChatGPT, como se detalla en este artículo, marca un avance significativo en el campo de la interacción con IA y la experiencia del usuario. Al integrar instrucciones personalizadas estratégicas, liberamos el potencial para interacciones más personalizadas, eficientes y conscientes del contexto con los sistemas de IA.
Los puntos clave del artículo revelan cómo los mecanismos de atención y la codificación posicional dentro de los modelos de IA, como ChatGPT, son fundamentales para procesar estas instrucciones. Esta capacidad permite un nivel de capacidad de respuesta y especificidad que antes no se podía alcanzar, lo que aumenta el control del usuario sobre las interacciones de IA.
Además, la aplicación práctica de estos conceptos a través del marco AutoExpert v3 demuestra la aplicabilidad en el mundo real y los beneficios de las instrucciones personalizadas.
En esencia, este artículo destaca el poder transformador de las instrucciones personalizadas en IA, ofreciendo una puerta de entrada a experiencias de IA más matizadas y personalizadas. A medida que sigamos innovando y ampliando los límites de la tecnología de IA, el papel de las instrucciones personalizadas sin duda será cada vez más central en la configuración del futuro de las interacciones entre IA y usuario.
Acerca del autor
Conozca a Stig Korsholm, un entusiasta de la tecnología y aficionado a la IA que ama sumergirse en las últimas tendencias e innovaciones en el mundo de la inteligencia artificial. Stig es actualmente el arquitecto de dominio principal en Bankdata y cuenta con una amplia experiencia en tecnología dentro del ámbito financiero y bancario.
Como autor invitado, Stig comparte sus conocimientos y experiencias únicas, haciendo que temas complejos sean accesibles y atractivos para todos. Con un don para combinar la tecnología con aplicaciones del mundo real, le apasiona ayudar a las empresas a aprovechar el poder de la IA para impulsar el éxito.
Cuando no está escribiendo o explorando nuevas tecnologías, puedes encontrarlo conectándose con otros innovadores y compartiendo ideas inspiradoras.
Conéctate con él en LinkedIn → aquí!
Suscríbete para recibir actualizaciones de las últimas publicaciones del blog
Deja tu comentario: