Cómo sacar el máximo partido a los modelos IA de razonamiento
Cómo sacar el máximo partido a los modelos IA de razonamientoGuía de buenas prácticas de OpenAI sobre cómo utilizar modelos de razonamiento. Diferencias frente a los modelos GPT. Flujos de trabajo IA y consejos sobre prompting.
¿Sabes cuándo utilizar un LLM de razonamiento y cuándo no? Si eres como yo, probablemente optarás por el modelo que entiendas más potente, independientemente de su tipo. En mi caso, por ejemplo, cuando veo el desplegable de ChatGPT, es difícil no elegir siempre el modelo o1 pro, que además, lleva la etiqueta “Best at reasoning”. ¿El mejor? Pues ahí que voy. Sin embargo, los modelos de razonamiento no tienen por qué ser siempre la mejor opción, especialmente si tienes en mente construir sistemas utilizando LLMs. En el post de hoy, hablaremos de las diferencias entre modelos de razonamiento y modelos generales, y cómo sacar el máximo partido a los primeros. Diferencias entre los modelos de razonamiento y los modelos GPTOpenAI, en la documentación de su API, tiene un excelente artículo sobre las mejores prácticas en relación con modelos de razonamiento. En el mismo, describe las diferencias entre sus distintos modelos:
Más adelante, explican cómo elegir entre uno u otro en función de qué es más importante para tu caso de uso:
En definitiva, podríamos decir que cuanta más incertidumbre haya en una tarea, más se beneficiará de un modelo de razonamiento. Y, a la inversa: utilizar uno de estos modelos para abordar una tarea sencilla es una magnífica forma de quemar dinero. Lo que vendría a ser matar moscas a cañonazos. Esta es la razón, por ejemplo, por la que OpenAI y otros ponen límites al número de consultas que puedes lanzar contra determinados modelos. Los costes pueden ser de un orden de magnitud superior. El problema, para OpenAI, por supuesto, es que el nombre de sus modelos y la interfaz donde los seleccionas parecen diseñados por su peor enemigo. Pero es que, que OpenAI tenga una interfaz de usuario es en sí un accidente. Era una compañía que nació enfocada en servir sus modelos a través de una API para terceros, pero entonces a alguien se le ocurrió lanzar ChatGPT, y el resto es historia. Ben Thompson lo argumenta en The Accidental Consumer Tech Company. Sam Altman, de hecho, avanzando hace unos días el roadmap de OpenAI, reconocía abiertamente que su oferta de producto era un desastre, y dejaba caer que GPT5 lo solucionará porque evitará tener que escoger. O, dicho de otra forma, GPT5 evaluará primero nuestra consulta y se encargará de enrutarla al modelo más adecuado:
¿Por qué es importante entender cómo funcionan los modelos?Si eres un usuario final que paga una suscripción fija al mes, la realidad es que el coste de cada consulta te es indiferente. Sin embargo, si quieres crear sistemas y productos que utilicen LLMs, lo más probable es que quieras optimizar tus costes y latencias, por lo que saber escoger el mejor modelo para cada tarea es imprescindible. Por ejemplo, OpenAI proporciona en su guía un ejemplo de flujo de trabajo IA en el que distintos modelos interactúan entre sí para resolver una petición típica a un servicio de atención al cliente. En ese ejemplo:
Cómo interactuar con un modelo de razonamientoOtro aspecto interesante de los modelos de razonamiento es que la técnica de prompting es distinta a la de los modelos GPT. Por ejemplo, OpenAI recomienda:
ConclusionesEl futuro de los modelos de lenguaje apunta hacia sistemas más integrados e inteligentes que simplificarán las decisiones técnicas. Sin embargo, mientras ese día llega, es crucial entender y saber utilizar las herramientas a nuestra disposición. Espero que el artículo de hoy os haya servido para entender un poco mejor las posibilidades de los distintos modelos y cómo sacarles el máximo partido en vuestro día a día. A mí, personalmente me ha servido para ahorrar tiempo en mis interacciones diarias, evitando gastar tiempo y recursos de razonamiento en consultas sencillas. Y, por supuesto, el ejemplo de un flujo de trabajo IA, también me ha servido para entender un poco más cómo se construyen estos sistemas, enlazando modelos de forma que podamos optimizar costes. Por cerrar con una recomendación, si queréis ahondar más sobre el tema, OpenAI ofrece un curso gratuito de apenas una hora en DeepLearning.ai que me ha gustado bastante: Reasoning with o1. ¡Disfrutadlo! |
Similar newsletters
There are other similar shared emails that you might be interested in: