estrategIA #51: Llega la era del razonamiento artificial: OpenAI lanza o1 y cambia las reglas del juego
Newsletter pionera en español sobre inteligencia artificial en la Política y el Gobierno. Impulsada por la Institución Educativa ALEPH
OpenAI o1: una nueva frontera en el “pensamiento” de las IAs y la resolución de problemas
OpenAI ha vuelto a redefinir los límites de la inteligencia artificial con el lanzamiento, la pasada semana, de su última serie de modelos, OpenAI o1. Este sistema revolucionario representa un avance significativo en las capacidades de razonamiento y resolución de problemas de las máquinas.
La serie o1 introduce un enfoque innovador en el procesamiento de la IA, diseñado para imitar el razonamiento humano de una manera más cercana que nunca. A diferencia de los modelos anteriores, que se centraban en el reconocimiento rápido de patrones y la generación de respuestas, o1 ha sido concebido para "pensar" de manera más cuidadosa antes de responder. Este enfoque deliberado permite al modelo abordar problemas complejos en áreas como la ciencia, la programación y las matemáticas con una precisión y profundidad sin precedentes.
Características clave de o1
Razonamiento mejorado: o1 emplea un proceso sofisticado de "cadena de pensamiento", descomponiendo problemas complejos en pasos manejables y refinando su enfoque de manera iterativa.
Mejora en la resolución de problemas: el modelo destaca en campos que requieren un pensamiento analítico profundo, como la física, la química, la biología y las matemáticas avanzadas.
Generación y depuración de código: o1 demuestra habilidades superiores en la generación y depuración de código complejo, convirtiéndolo en una herramienta poderosa para los desarrolladores.
Diseño centrado en la seguridad: OpenAI ha implementado nuevos enfoques de entrenamiento en seguridad que aprovechan las capacidades de razonamiento de o1 para adherirse mejor a las pautas éticas y las normas de seguridad. Al razonar mejor sobre las políticas de seguridad fijadas por OpenAI este modelo corre menos peligro de ser utilizado para fines maliciosos pese a su mayor capacidad.
Las variantes de o1-preview y o1-mini ya están disponibles para todos los clientes de pago de GPT-4 y el modelo original aún sólo en manos de OpenAI (con el que se rumorea que están entrenando al futuro “GPT-5”)
o1-preview: es la versión completa, diseñada para abordar las tareas de razonamiento más complejas en diversos dominios.
o1-mini: una versión más pequeña, rápida y rentable, optimizada específicamente para tareas de programación. Ofrece el 80% del rendimiento a un 20% del costo en comparación con o1-preview.
Rendimiento en benchmarks
El modelo o1 (el que de momento sólo tiene internamente OpenAI) ha demostrado un rendimiento notable en una gran variedad de pruebas, destacando sus avanzadas capacidades de razonamiento:
Examen clasificatorio de la Olimpiada Internacional de Matemáticas: o1 alcanzó un impresionante 83% de precisión, en comparación con el 13% logrado por GPT-4o.
Competiciones de Codeforces: o1 se posicionó en el percentil 89, demostrando habilidades excepcionales en programación.
Examen Invitacional Americano de Matemáticas: o1 se situó entre los 500 mejores estudiantes de EE. UU.
GPQA (Examen de Física, Biología, Química a nivel de doctorado): o1 superó la precisión de humanos con doctorado en estos dominios científicos.
Más allá de los datos de rendimientos en benchmarks que ofrece la propia OpenAI (y hay que tener en cuenta que muchos benchmarks están saturados y ya no tienen forma de medir bien las capacidades “casi sobrehumanas” de algunos modelos) Internet se ha llenado de casos interesantes de personas que han utilizado o1-preview (hay que recordar que el modelo completo, o1, parece muy superior en las evaluaciones a este que es el que ya tenemos disponible), a modo de pequeña muestra les dejamos los siguientes enlaces por si quieren ver algunas de las increíbles capacidades del nuevo modelo:
Aplicaciones y casos de uso
Es importante comentar que para muchos de los usos “cotidianos” en los que utilizamos IA, por ejemplo para trabajar en la redacción de esta newsletter, no es el modelo adecuado porque está muy enfocado aún, al ser un modelo muy nuevo, en cuestiones muy concretas donde su capacidad de razonamiento lo vuelve diferencial. Cabe esperar que dentro de poco puedan integrar todas esas capacidades en conjunción con la multimodalidad y con mayores ventanas de contexto, incluso con el acceso a Internet del modelo. Pero, por otra parte, las capacidades mejoradas de razonamiento de o1 abren un amplio rango de aplicaciones potenciales diferenciales en diversas industrias especialmente en campos como la investigación científica, el desarrollo de software, el análisis financiero o la salud.
Como comentamos más arriba, a pesar de sus capacidades impresionantes, o1 (y más aún las versiones a las que tenemos acceso a día de hoy, preview y mini) no está exento de limitaciones como las dos siguientes:
Grietas funcionales: como modelo temprano, o1 carece de algunas funciones presentes en otros sistemas de IA, como la navegación web y las capacidades de procesamiento de imágenes. Es un modelo ahora mismo únicamente textual.
Coste y velocidad: o1 es significativamente más costoso de usar (a día de hoy) que los modelos anteriores, con mayores costos de entrada y salida. También puede ser más lento al procesar consultas complejas.
El que quiera conocer más al detalle las posiblidades y limitaciones de este modelo le recomendamos este excelente resumen de un “AMA” con el equipo de desarrollo de o1.
Conclusión: el futuro del razonamiento de la IA
Si me permiten una apreciación personal, basada en múltiples comentarios de expertos de la industria e incluso trabajadores del propio proyecto, la importancia de o1 no radica en el modelo en sí mismo sino que esta vía que se abrió en la práctica según OpenAI hace apenas un año está consiguiendo una mejora continua muy rápida de los modelos y nos da además otra escala en la que mejorar además de la pura potencia en el entrenamiento del modelo, en este caso el tiempo de inferencia para las respuestas y su forma de “razonar”. Esto va a ser diferencial y probablemente estemos al inicio de un nuevo salto enorme en las IAs cuyo resultado veremos en los próximos meses.
La introducción de o1 marca un hito significativo en la evolución de los sistemas de IA. Al incorporar procesos de razonamiento más parecidos a los humanos, o1 representa un paso relevante hacia la inteligencia artificial general.
Si bien o1 aún se encuentra en sus primeras etapas y enfrenta algunas limitaciones, su impacto potencial en diversas industrias y disciplinas científicas puede ser inmenso. A medida que OpenAI continúe refinando y ampliando la serie o1, es probable que veamos avances aún más impresionantes en las capacidades de razonamiento y resolución de problemas de la IA en un futuro cercano.
Nota importante: El nuevo modelo parece preferir tipos muy diferentes de “instrucciones” Es algo que abordamos más abajo en este mismo número en la sección de prompts para GPT-4. Les recomendamos no perderse dicha sección y tener eso muy presente si quieren aprovechar al máximo o1-preview.
Fernando Nieto Lobato
Director de Innovación Digital de la Institución Educativa ALEPH
Difunda estrategIA: explorando la inteligencia artificial y la política juntos
Le invitamos a que comparta estrategIA con sus amigos y colegas interesados en la intersección entre la inteligencia artificial y la política y el gobierno. Pueden acceder a la newsletter de manera gratuita y sin necesidad de suscripción desde el siguiente enlace:
Actualidad y artículos de interés
Mario Draghi propone una hoja de ruta para impulsar la competitividad europea en inteligencia artificial
Mario Draghi, ex primer ministro de Italia, ha presentado un informe titulado The Future of European Competitiveness, que propone, entre otras medidas económicas, una serie de estrategias para posicionar a Europa como líder en inteligencia artificial frente a Estados Unidos y China. Las propuestas incluyen aumentar la capacidad de computación, desarrollar modelos de IA en sectores clave como la automoción y la biotecnología, armonizar regulaciones, incentivar la inversión privada y fortalecer el ecosistema de computación cuántica. Draghi también subraya la importancia de fortalecer la soberanía digital europea mediante una "nube soberana" que proteja los datos sensibles.
La IA demuestra ser más efectiva que los humanos al refutar teorías conspirativas
Un estudio reciente revela que una versión de ChatGPT es sorprendentemente eficaz al refutar creencias en teorías conspirativas. Los participantes, que interactuaron con la IA sobre creencias erróneas como que el Covid-19 fue un intento de control poblacional, redujeron su fe en estas teorías en un 20% de promedio. La IA proporcionaba contrapruebas y señalaba fallos lógicos en tiempo real, algo que los humanos a menudo encuentran tedioso. Según los investigadores, el éxito del experimento radica en la capacidad de la IA para presentar rápidamente información desconocida, disminuyendo la confianza excesiva de los creyentes en sus ideas.
Una nueva IA detecta más de 1,000 enfermedades antes de la aparición de síntomas, según investigadores
Investigadores de AstraZeneca han desarrollado MILTON, una IA capaz de detectar signos tempranos de más de 1,000 enfermedades, incluyendo Alzheimer y EPOC, mucho antes de que aparezcan los síntomas. La herramienta analiza datos rutinarios de pacientes, como pruebas de sangre y orina, para identificar patrones predictivos. Los resultados, calificados de "excepcionales" para 121 enfermedades, podrían permitir intervenciones preventivas tempranas. Sin embargo, expertos advierten sobre posibles problemas éticos, como el uso indebido de datos por aseguradoras o empleadores, subrayando la necesidad de regulaciones estrictas.
California busca soluciones con IA generativa para desafíos clave como la vivienda y la falta de recursos
El estado de California ha invitado a empresas de inteligencia artificial a presentar herramientas de IA generativa para abordar grandes desafíos estatales, como la vivienda, la falta de recursos y la planificación económica. Este esfuerzo forma parte de una iniciativa impulsada por el gobernador Gavin Newsom, quien, tras una cumbre sobre IA generativa, identificó áreas clave donde esta tecnología puede ofrecer soluciones.
El MI6 y la CIA adoptan la IA generativa para combatir amenazas tecnológicas
Los directores de la CIA, Bill Burns, y del MI6, Richard Moore, han revelado que sus agencias están utilizando IA generativa para mejorar actividades de inteligencia, desde el análisis de grandes volúmenes de datos hasta la protección de sus operaciones. En un artículo conjunto, señalaron que el uso de tecnología avanzada es crucial para enfrentar amenazas como las campañas de desinformación de Rusia y los retos tecnológicos y geopolíticos de China. La IA también se emplea para monitorear contenido extremista en internet y mejorar la interacción con comunidades criminales, destacando su papel en la guerra en Ucrania y en la defensa de la estabilidad
La IA afectará a 60 millones de empleos en EE.UU. y México el próximo año, según un estudio del BID
Un estudio del Banco Interamericano de Desarrollo (BID) revela que la inteligencia artificial afectará a 60 millones de empleos en Estados Unidos y México en el próximo año. Aunque no implica necesariamente pérdidas laborales, la IA cambiará profundamente el mercado de trabajo. Las mujeres y los trabajadores poco cualificados serán los más vulnerables, ya que ocupan puestos más expuestos a la automatización. El estudio recomienda inversiones en educación y reentrenamiento en habilidades complementarias a la IA, y pide a los gobiernos mejorar las redes de protección social para mitigar los efectos negativos.
IA en acción (nuestro rincón más práctico)
Herramienta de IA de la semana
En general hasta ahora cuando uno quería generar imágenes con IA a partir de un referente concreto tenía que realizar un “entrenamiento” del modelo si quería conseguir resultados decentes. La semana pasada apareció esta solución de personalización de identidad para generar imágenes de IA con Flux a partir de una única imagen y, aunque no consigue resultados tan avanzados, es bastante buena y tremendamente fácil de usar en la versión que les traemos en Hugging Face, simplemente hay que subir una imagen de “guía” del personaje y darle a crear (aunque como siempre se pueden ajustar algunos parámetros avanzados)
Les invitamos, por su gran sencillez, a que la prueben, aquí les dejamos una muestra muy sencilla de cómo a partir de la primera fotografía y de un prompt bastante sencillo ha generado la segunda imagen usando Flux dev pero conservando, en este caso, el rostro del expresidente estadounidense.
Prompts para GPT-4 (para o1 en este caso)
Como les comentábamos al final del artículo principal, o1 no sólo es un modelo muy potente de razonamiento especialmente útil para determinados campos sino que se trata de una arquitectura muy distinta que requiere, como bien se nos ha indicado desde OpenAI, de “prompts” bastante distintos para funcionar correctamente. Estas son las claves que OpenAI nos ha proporcionado para crear buenas instrucciones en general para el modelo:
También hay que decir que no es sencillo encontrar prompts para nuestros campos habituales de la newsletter en los que sacar todo el jugo a la arquitectura y potencia de o1, pero hemos encontrado tras varias pruebas este, que le hizo razonar durante 23 segundos lo que nos parece indicar que sí es una petición capaz de beneficiarse del nuevo modelo. Les dejamos en este caso, que entendemos que muchos de ustedes (los que no tengan chatGPT de pago) no podrán usarlo aún directamente, la respuesta al prompt.
Actúa como un experimentado diplomático internacional especializado en negociaciones climáticas y simula una negociación multilateral sobre cambio climático entre Estados Unidos, China, la Unión Europea, India y Brasil. Describe detalladamente las posiciones iniciales de cada parte, los puntos de conflicto potenciales, y propón una estrategia de negociación integral que podría conducir a un acuerdo viable, teniendo en cuenta las complejas dinámicas geopolíticas y económicas actuales.
Lo más interesante seguramente de este modelo, además, por supuesto, del resultado final, es ver el resumen que OpenAI nos muestra de su proceso de pensamiento y que les adjuntamos a continuación para este caso (lo pueden ver también desplegando la pestaña en la respuesta al prompt)
Recomendación de la semana
Chris Samra, cofundador de Symphonic Labs, ha anunciado el lanzamiento de una nueva herramienta de inteligencia artificial llamada "Read Their Lips" que permite leer los labios en videos. Esta tecnología utiliza un modelo de IA para identificar el habla inaudible analizando los movimientos de los labios de las personas en los videos. Esto, parece claro, puede tener algunas consecuencias negativas bastante obvias dependiendo de su uso.
La herramienta está disponible en el sitio web readtheirlips.com