estrategIA #21 Revolución audiovisual: cómo Sora cambia las reglas del juego en la creación de contenido

Newsletter pionera en español sobre inteligencia artificial en la Política y el Gobierno. Impulsada por la Institución Educativa ALEPH

feb 21, 2024

Sora: Un salto cualitativo en IA para crear vídeos realistas que requiere una respuesta social coordinada

El pasado jueves, 15 de febrero, OpenAI presentaba Sora y este titular, de Marcos Merino en Genbeta, puede ser el mejor resumen para evaluar el impacto que causó el nuevo modelo: “No te creas nada de lo que veas: OpenAI tiene una nueva IA y genera vídeos realistas. Así es Sora”

Un sentimiento similar fue el que expresaron en sus artículos cientos de periodistas tecnológicos y expertos en IA en redes sociales y es que, si bien los avances en IA de generación de video parecían ser una de las claras tendencias para este 2024, lo que presentó OpenAI supera por mucho el estado de la cuestión actual y parece provenir del futuro, como afirmaba DotCSV en su video en directo de reacción al lanzamiento. Estamos ante una herramienta de generación de video que permite crear escenas de gran duración, frente a los pocos segundos que se podían hasta ahora con cualquiera de las opciones de la competencia, y que es tan potente que OpenAI está frenando su lanzamiento al mercado por el peligro inherente de generación masiva de deepfakes de calidad profesional.

Lo mejor es que veáis primero por vosotros mismos los videos que es capaz de crear, bien en la web de Sora de OpenAI, o directamente en esta recopilación en Youtube (la música no es de los videos, de momento no trabaja con audio aunque en la sección de recomendación de la semana os mostramos lo que rápidamente ha sacado ElevenLabs para acompañar a Sora.)

Una vez vistas sus capacidades vamos a intentar analizar brevemente que supone SORA y sus implicaciones, también en la política:

En el panorama actual de la inteligencia artificial, el lanzamiento de Sora por OpenAI representa un salto cualitativo en la capacidad de generación de contenido digital. Este modelo de IA, capaz de transformar descripciones textuales en videos realistas y complejos, no solo promete revolucionar la industria creativa, sino también plantea nuevos desafíos y oportunidades en el ámbito político y electoral.

Capacidades técnicas y avances de Sora

Sora se distingue de sus predecesores y competidores por su habilidad para crear videos, de hasta un minuto de duración, con un nivel de realismo fotográfico y fidelidad a las instrucciones textuales sin precedentes. Utilizando una arquitectura de transformers y procesos de difusión, Sora maneja “parches visuales” para generar contenido que no solo cumple con los requisitos del usuario, sino que también demuestra una comprensión emergente de la gramática cinematográfica. Este avance técnico es significativo, permitiendo la creación de narrativas visuales complejas y emotivas a partir de simples textos.

Implicaciones políticas y electorales

La capacidad de Sora para generar contenido visual convincente y emocionalmente resonante a partir de texto plantea importantes consideraciones para el campo político y electoral. Por un lado, ofrece herramientas poderosas para la comunicación política y la campaña electoral, permitiendo a los candidatos y partidos crear material de campaña altamente personalizado y emocionalmente atractivo sin los costos asociados a la producción tradicional.

Sin embargo, estas mismas capacidades generan preocupaciones significativas en torno a la desinformación y la manipulación electoral. La habilidad de generar vídeos realistas puede ser aprovechada para crear deepfakes políticos, complicando la ya difícil tarea de discernir la verdad en el discurso público. Esto puede tener un impacto profundo en la integridad electoral, especialmente en un momento en que la información falsa se propaga rápidamente a través de las redes sociales.

Reconociendo estos riesgos, OpenAI, además de retrasar el acceso público al modelo, está implementando medidas de seguridad, incluidas restricciones en el tipo de contenido que Sora puede generar y herramientas para identificar los videos creados por IA. Sin embargo, el desafío de la desinformación trasciende las capacidades técnicas y requiere una respuesta coordinada que involucre a la sociedad en su conjunto, incluidas las plataformas de redes sociales y los organismos reguladores.

Además, la emergencia de Sora subraya la necesidad de educar al público sobre la inteligencia artificial y sus capacidades, fomentando un escepticismo saludable hacia el contenido digital y promoviendo la verificación de fuentes como prácticas estándar en el consumo de información.

A medida que Sora y tecnologías similares continúan desarrollándose, es imperativo que los creadores, reguladores y el público trabajen juntos para maximizar los beneficios de estas herramientas mientras se mitigan sus riesgos. Esto incluye el desarrollo de normativas y políticas que promuevan la transparencia y la responsabilidad en la generación de contenido de IA, así como la investigación continua en métodos de detección de deepfakes y otras formas de desinformación.

Pero por si todo esto fuera poco, Sora parece dar un paso más allá en lo que respecta a la capacidad de comprensión de mundos y de físicas por la inteligencia artificial, para entender mejor este concepto y las posibilidades que abre la simulación de mundos os recomendamos este video de Xavier Mitjana.

Fernando Nieto Lobato

Director de Innovación Digital de la Institución Educativa ALEPH

Comparta estrategIA: uniendo IA y Política

Invite a otros a leer, gratis y sin necesidad de suscribirse, esta publicación con el siguiente botón:

Actualidad y artículos de interés

Unión histórica de gigantes tecnológicos contra la IA engañosa para las elecciones de 2024

En un movimiento sin precedentes, más de 20 empresas líderes en el sector tecnológico, incluidas Adobe, Amazon, Google, IBM, Meta, Microsoft, OpenAI, TikTok y X, han firmado un acuerdo para combatir la desinformación generada por inteligencia artificial en el contexto de las elecciones globales de 2024. Este pacto, anunciado en la Conferencia de Seguridad de Múnich, busca desarrollar herramientas para identificar y neutralizar el contenido falso de IA destinado a influir en los votantes. Este esfuerzo conjunto representa un compromiso crucial para proteger la integridad electoral y aumentar la resiliencia social ante las amenazas que supone la IA en los procesos democráticos. Las empresas se comprometen a trabajar colaborativamente en el desarrollo e implementación de tecnologías, así como en iniciativas educativas para mejorar la conciencia pública y la transparencia.

Preocupación en Corea del Sur por la manipulación electoral mediante deepfakes en las elecciones del 10 de abril

Las elecciones parlamentarias del 10 de abril en Corea se encuentran amenazadas por la utilización de deepfakes, tecnología de inteligencia artificial que genera contenido sintético muy realista. La Comisión Nacional Electoral identificó 129 casos de contenido electoral utilizando deepfakes entre el 29 de enero y el 16 de febrero, violando la Ley de Elección de Funcionarios Públicos. Expertos advierten sobre el impacto significativo de los deepfakes en la percepción de los votantes indecisos, destacando la facilidad con la que se pueden crear estas falsificaciones. Incidentes recientes, como la difusión de un video manipulado del presidente Yoon Suk Yeol y un clip deepfake del líder interino del Partido del Poder Popular, Han Dong-hoon, resaltan la problemática. En respuesta, se aprobó una revisión de la ley que prohíbe el contenido de campaña política que utiliza deepfakes durante la temporada electoral, con severas penalizaciones para los infractores. Sin embargo, se subraya la necesidad de aumentar la conciencia pública y el pensamiento crítico frente a los contenidos en internet.

TikTok creará un centro de elecciones para combatir la desinformación antes de las elecciones europeas

TikTok lanzará un Centro de Elecciones en la aplicación para contrarrestar la desinformación en línea durante las elecciones al Parlamento Europeo de 2024. Este centro ofrecerá información confiable en los idiomas locales de los 27 países de la UE, ayudando a sus 134 millones de usuarios mensuales en Europa a discernir entre hechos y ficción. La iniciativa, que estará disponible en marzo, busca informar a los votantes europeos sobre el proceso electoral, con contenidos claramente señalizados. TikTok destaca su equipo de 6,000 personas dedicadas a moderar contenido en idiomas de la UE. Además, la plataforma intensifica sus esfuerzos para contrarrestar la desinformación mediante la verificación de hechos y la promoción de la alfabetización mediática, e introduce reportes sobre operaciones de influencia encubierta para aumentar la transparencia. Estas medidas, anunciadas tras el lanzamiento del nuevo Acta de Servicios Digitales de la UE, reflejan el compromiso de TikTok con la seguridad y la integridad durante el período electoral, en un esfuerzo por limitar los actores engañosos y el contenido generado por IA que podría propagar desinformación.

Solo las personas pueden patentar invenciones, no la IA, afirma el gobierno de EE.UU.

El gobierno de Estados Unidos, a través de la Oficina de Patentes y Marcas (USPTO), ha establecido que para obtener una patente es necesario que una persona real haya realizado una "contribución significativa" a la invención, excluyendo así a la inteligencia artificial (IA) como inventor en las patentes. Esta directriz busca asegurar que las creaciones asistidas por IA puedan ser patentadas, manteniendo al mismo tiempo el papel central de la creatividad y la ingeniería humana en el proceso de invención. Aunque la definición de "contribución significativa" es algo ambigua y depende del caso específico, la guía refleja el esfuerzo de la administración Biden por anticiparse a los desafíos que presenta la IA. Esta medida se alinea con la tendencia actual de requerir una agencia humana en la creación de contenido protegido por derechos de autor, permitiendo el uso de sistemas basados en IA para asistir en la creación, siempre y cuando haya una participación humana suficiente.

CEO de NVIDIA aboga por la IA soberana en la Cumbre Mundial de Gobiernos

En la Cumbre Mundial de Gobiernos en Dubái, Jensen Huang, fundador y CEO de NVIDIA, enfatizó la necesidad de que cada país desarrolle su propia inteligencia artificial soberana, destacando la importancia de poseer la producción de inteligencia y datos nacionales. Durante un diálogo con el Ministro de IA de los Emiratos Árabes Unidos (EUA), Su Excelencia Omar Al Olama, Huang resaltó la IA soberana como una oportunidad enorme para codificar la cultura, inteligencia común e historia de una sociedad. EUA está avanzando rápidamente en la creación de grandes modelos de lenguaje, alineándose con la visión de Huang. Este impulso por la IA soberana promete un significativo impacto económico en el Medio Oriente, con una proyección de 320.000 millones de dólares hacia 2030.

Puerto Rico avanza hacia la regulación del uso de inteligencia artificial en el gobierno

José Aponte, expresidente de la Cámara de Representantes de Puerto Rico, anunció la presentación del Proyecto de la Cámara 2027, marcando un hito como la primera iniciativa legislativa en la isla dedicada exclusivamente a regular el uso de la inteligencia artificial en la administración pública. Este proyecto busca posicionar a Puerto Rico al nivel de otros 31 estados de EE.UU. que ya han implementado normativas para el uso gubernamental de algoritmos de IA, incluida la IA Generativa. Mediante la modificación de varios artículos de la Ley Número 75-2019, se establecerá un marco regulatorio que obligará a las agencias gubernamentales a solicitar autorización para el uso de IA a la Oficina de Innovación y Servicios de Tecnología, encargada de evaluar, autorizar y fiscalizar estas tecnologías. Además, se introducirán multas administrativas para las agencias que incumplan con la nueva normativa, reforzando así la seguridad y la implementación responsable de la IA en los procesos gubernamentales.

BOJA 3.0: Inteligencia artificial para revolucionar el acceso a la información oficial en Andalucía

La Junta de Andalucía está implementando una significativa actualización en el Boletín Oficial de la Junta de Andalucía (BOJA), denominada proyecto Boja 3.0, con el objetivo de mejorar la accesibilidad y eficiencia de este servicio esencial. Esta renovación incorporará tecnología de inteligencia artificial para ofrecer nuevos servicios de búsqueda avanzada, asesoramiento personalizado y alertas sobre temas de interés específico para los usuarios. Se incluirá un asistente conversacional que interactuará con los usuarios en un lenguaje sencillo, disponible las 24 horas del día, mejorando significativamente la experiencia de acceso a la información oficial. Además, se facilitará el inicio de trámites publicados en el BOJA, como solicitudes de subvención, mediante un sistema más accesible e intuitivo. Este avance forma parte de un decreto-ley de simplificación administrativa que modificará numerosas normas para reducir la complejidad y el número de aplicaciones utilizadas por la Junta de Andalucía.

Microsoft impulsa la inteligencia artificial en España con una inversión histórica

En un encuentro en Madrid, Pedro Sánchez, presidente del Gobierno español, y Brad Smith, presidente de Microsoft, han formalizado un acuerdo que amplía significativamente la inversión de Microsoft en infraestructura de inteligencia artificial y tecnología en la nube en España, alcanzando un monto de 2.100 millones de dólares para los años 2024 y 2025. Este compromiso, el más grande en los 37 años de operaciones de Microsoft en España, incluye la creación de una Región Cloud de Centros de Datos en la Comunidad de Madrid y un campus de Centros de Datos en Aragón. Estas instalaciones facilitarán el acceso a soluciones de IA para empresas y entidades gubernamentales españolas y europeas. El acuerdo, alineado con la Estrategia Nacional de Inteligencia Artificial y la Estrategia Nacional de Ciberseguridad de España, se centra en cuatro ejes principales: la adopción de IA en la administración pública, la promoción de una IA responsable, el fortalecimiento de la ciberseguridad nacional, y la mejora de la resiliencia informática en las empresas. Brad Smith destacó el rápido crecimiento del uso de IA en España y la importancia de prepararse para los desafíos futuros, incluyendo el cambio demográfico y la necesidad de generar empleos en el sector tecnológico.

IA en acción (nuestro rincón más práctico)

Herramienta de IA de la semana

Stable Cascade

Stable Cascade se posiciona como un innovador modelo en el ámbito de la inteligencia artificial generativa, destacando por su eficiencia y calidad superior en la generación de imágenes a partir de textos prompts. Desarrollado por el equipo detrás de Stable Diffusion, este modelo introduce una novedosa metodología de procesamiento en cascada, permitiendo trabajar en un espacio latente significativamente reducido y, por ende, optimizando los tiempos de inferencia sin comprometer la calidad de las imágenes generadas.

Este avance tecnológico es particularmente relevante ya que, además de ofrecer una calidad comparable e incluso superior a modelos como SDXL y SDXL Turbo, Stable Cascade logra reducir a la mitad los tiempos de inferencia.

Hay que destacar de Stable Cascade, más allá de su impresionante desempeño técnico, que además tiene origen español, siendo el resultado del trabajo de Pablo Pernias y su equipo. Aunque por el momento se encuentra disponible bajo una licencia No Comercial puede probarse ya en:

https://huggingface.co/spaces/multimodalart/stable-cascade

Prompts para GPT-4

Esta semana hemos trabajado con GPT-4 para generar prompts concretos que nos ayuden a pensar sobre la mejor forma en que podemos utilizar la IA para la política. Estos dos pueden ser un buen ejemplo:

Actúa como un experto en ciencia política y tecnología, y analiza cómo la implementación de la microsegmentación mediante inteligencia artificial puede optimizar la eficacia de las campañas políticas, garantizando al mismo tiempo la integridad del proceso democrático y evitando la manipulación indebida de los electores. Genera además dos ejemplos concretos.

Actúa como un experto en análisis de datos y ciencia política con experiencia en inteligencia artificial, e investiga cómo el análisis sentimental realizado por IA sobre datos de redes sociales puede influir y optimizar las estrategias de comunicación política.

Recomendación de la semana

Los avances que Sora propone para el video son tremendamente relevantes, tal y como os hemos contado en el artículo principal, pero ahora mismo esa generación de video se hace sin sonido. Aprovechando ese vacío y la oportunidad “publicitaria” La startup de inteligencia artificial ElevenLabs, conocida por sus servicios de voz sintética casi humana, anunció, utilizando como ejemplo algunos propios videos de Sora a los que dotó de audio, una innovación que permite agregar efectos de sonido artificial a vídeos generados por IA. La empresa ha iniciado una lista de espera para quienes estén interesados en esta tecnología,

Les invitamos a ver este ejemplo (asegúrense de activar el sonido) que nos permite vislumbrar como en muy pocos años o quizá incluso en meses serán los videos (con audio) que podremos crear nosotros mismos directamente desde una simple instrucción de texto: