El nacimiento de la vIA Europea

La Inteligencia Artificial (IA) se ha convertido en una política de estado. Estados Unidos priorizan los principios del capital, dejando en manos privadas todas las decisiones importantes. La libertad (de hacer dinero) del individuo por encima de todo. China, en cambio, controla, por vía del estado omnipresente, los avances y usos de la IA, siguiendo la ética oriental de priorizar los objetivos colectivos por encima de los personales (¿eres un buen ciudadano?). Y en medio de ambas, Europa busca su sitio. Un encaje que permita combinar los derechos individuales y el bienestar social que caracterizan a los principios comunes europeos, con la innovación tecnológica y la valorización de los datos. Durante una década, esta búsqueda ha parecido incapaz, ineficiente e infructuosa, con un par de excepciones dignas de mención.

La más relevante contribución Europea ha sido la GDPR. Una legislación ambiciosa y exigente en la gestión de datos personales que obliga a las dos superpotencias alternativas a reconsiderar sus posiciones de máximos. Marcar la agenda mundial de la gestión de datos es un hito sin precedentes en el campo de los derechos digitales. Más allá de la GDPR, falta por ver si las guías de uso ético y confiable de la IA, promovidos por la Comisión Europea (HLEG-AI Guidelines) y, en especial, la legislación que se prepara para el ámbito europeo (AI Act) tendrán éxito o no.

Pero más allá de estas contribuciones éticas y legislativas, ¿qué más puede aportar Europa?
Hasta 2022, parecía que el tejido investigador europeo, distribuido, ligado a la docencia ya los fondos competitivos, era incapaz de mantener el ritmo de las entidades centralizadas e hiperespecializadas de EE.UU. y China. El mundo, abocado a que unas pocas empresas americanas y chinas (p. ej., OpenAI y DeepMind) marcaran la agenda pública e industrial de la IA, ante la aparente indiferencia del secretismo chino. Competir con empresas que tienen procesos ágiles, carentes de burocracia y consideraciones éticas, es complicado. Más aún cuando el valor de las contribuciones se mide en impacto sobre la opinión pública. ¿Gastar millones de dólares por el entrenamiento de un modelo de IA sólo para poder tener el más caro de todos? ¡Oh, yeah!

Europa no entró en este juego, con razón, aunque dispone de una infraestructura computacional adecuada. Por un lado, los centros públicos de supercomputación, bien regulados, no pueden competir en flexibilidad en la carrera de marketing que es la IA del siglo XXI. Por otro, la limitada relevancia científica de hacer modelos de IA más grandes simplemente porque podemos no justifica el enorme gasto medioambiental y económico asociado.

Así las cosas, la IA más impresionante parecía destinada a ser una tecnología controlada por unos pocos, con un modelo de negocio basado en la suscripción, y donde los modelos entrenados son la más preciada propiedad empresarial. Modelos privativos como GPT3 (para la generación automática de texto) o DALL-e (para la generación automática de imágenes) parecían inalcanzables. Hasta 2022. Este año lo ha cambiado todo. Una iniciativa financiada por instituciones de investigación francesas, con la participación de investigadores de más de sesenta nacionalidades (BigScience), entrenó a un modelo de lenguaje natural del tamaño de GPT3. En primavera fue liberado BLOOM, el mayor modelo de lenguaje natural de uso público y gratuito. Cualquier individuo o empresa puede superar el test de Turing con el ordenador de sobremesa. Pero esto no es todo. En agosto, Stability.AI, una empresa europea, invirtió 600K€ en entrenar un modelo generador de imágenes llamado StableDiffusion, logrando resultados comparables a DALL-E2, para luego liberarlo, permitiendo el uso público y comercial del modelo. La comunidad explotó, y la popularidad de la herramienta ya ha superado la de los modelos privativos existentes, poniendo a Stability.AI en el centro del escenario. Ya se habla de ofertas milmillonarias por la compañía, lo que ayudará a dar la vuelta a la mentalidad dominante que decía «un modelo de IA privado es más valioso que uno público».

BLOOM y StableDiffusion son herramientas que habilitarán la creación de iniciativas públicas y privadas en todos los sectores relacionados con el lenguaje natural y la imagen. Serán la semilla de muchos productos y servicios que veremos aparecer en nuestras vidas durante 2023, revolucionando sectores como el audiovisual, el arte, la publicidad, la atención personal y el entretenimiento. Pero esto no es todo. BLOOM y StableDiffusion han influenciado la filosofía imperante de sus competidores. En un movimiento reactivo, OpenAI liberó en septiembre el código y el modelo de Whisper, un transcriptor de voz a texto, capaz de interpretar acentos enrevesados en 52 idiomas (donde el catalán es el décimo que mejor funciona). La mancha de aceite de los modelos abiertos comienza a extenderse.

La vÍa Europea ha tardado en llegar, y podría considerarse en 2022 como el año de su nacimiento. Una vía de código y modelos abiertos, donde la innovación es democratizada y accesible, superando viejos dogmas sobre el control de los recursos y avanzando hacia una competición meritocrática con principios éticos. Falta por ver hasta qué punto la burocracia europea asumirá y apoyará este camino.

Ahora bien, queda por hacer lo más complicado. Existe un montón de aspectos éticos y legales a considerar, derivados de entrenar, liberar y usar estos modelos, que ahora reclaman atención urgente. Europa está llamada a jugar un papel esencial, balanceando derechos fundamentales, equidad y progreso social. Preguntas como, ¿es legítimo que un modelo aprenda de datos con copyright? ¿Es compatible esto con la supervivencia de sectores como el artístico y el cultural? ¿Es adecuado utilizar modelos entrenados sobre datos que reflejan los peores sesgos de nuestra sociedad, reproduciendo y perpetuando la discriminación? Las respuestas a estas preguntas marcarán el futuro de la IA y de nuestra sociedad. La disponibilidad de modelos abiertos permite que podamos ponernos a resolver estos retos desde hoy, pero también nos obliga a no dejarlo para mañana.

Dario Garcia Gasulla

Universidad Politécnica de Cataluña (UPC); Barcelona Supercomputing Centre (BSC)

20 de septiembre de 2024

La IA en el ámbito público local

Ramon Pruneda

La disrupción de la Inteligencia Artificial (IA) es hoy indiscutible en casi todos los ámbitos de nuestra sociedad. Los recientes avances en grandes Modelos de […]

27 de enero de 2026

Del hype tecnológico a una IA ética, humana y estratégica: una visión desde el CIDAI

Marco Orellana

En aquest context de creixement i evolució dels models de llenguatge constant, és important que considerem adoptar i adaptar petits models de llenguatge quan desenvolupem eines basades en models de llenguatge natural.

28 de abril de 2026

Claves para aplicar la IA en operaciones

Jaume Clotet

La inteligencia artificial ha dejado de ser una promesa de futuro para convertirse en una realidad presente. Cada semana, nuevas herramientas y plataformas aparecen en […]