Conoce ALIA, la IA generada por el gobierno de España y que deja mucho que desear

¿Por qué ALIA, la IA multilingüe del Gobierno de España, está siendo criticada?

23 enero, 2025 5 min read

En un mundo donde la inteligencia artificial (IA) está transformando sectores como la salud, la educación y la forma en como nos relacionamos con el mundo digital, el gobierno de España ha decidido sumarse a esta revolución con su propio desarrollo: ALIA. Este proyecto, liderado por el Centro de Supercomputación de Barcelona (BSC), marca un hito al ser la primera IA pública generada y financiada enteramente por el Estado español. Sin embargo, su lanzamiento ha estado rodeado de polémica, ya que su rendimiento no parece estar a la altura de las expectativas, especialmente cuando se compara con modelos ya establecidos como Llama 2 de Meta, presentado en 2023.

¿Qué ofrece ALIA a sus usuarios?

En primer lugar, ALIA es un modelo de inteligencia artificial multilingüe. Esto significa que es capaz de operar en español y en las lenguas cooficiales de España, como el catalán, el euskera, el valenciano o el gallego. El proyecto nace con el objetivo de fomentar la diversidad lingüística y cultural, asegurándose que dichas lenguas no queden relegadas en el desarrollo tecnológico. Además, ALIA busca democratizar el acceso a la IA, ofreciendo herramientas accesibles tanto para la administración pública como para ciudadanos, universidades y empresas.

ETHEREUM LANZA ETHEREALIZE PARA TRABAJAR CON WALL STREET

Para lograr todo esto, el modelo fue entrenado en el supercomputador MareNostrum 5, uno de los sistemas más potentes de Europa, lo que debería garantizar un alto nivel de rendimiento.

De hecho, los desarrolladores de ALIA han informado en su cuenta de HuggingFace, algunos datos interesantes sobre el hardware utilizado donde destacan el uso de 1120 nodos computacionales, formados por 4x Nvidia Hopper GPUs with 64GB HBM2, 2x Intel Sapphire Rapids 8460Y+, 4x NDR200, 512 GB de memoria DDR5 y 460GB en disco NVME. Con esos datos y especificaciones, no queda duda que es una poderosa computadora para entrenar modelos de alta calidad.

Los planes del Gobierno de España para ALIA

Es por ello que el Gobierno de España ha destacado varias aplicaciones prácticas para ALIA. Desde la simplificación de trámites administrativos hasta la mejora de diagnósticos médicos. Fueron anunciados dos proyectos piloto: un chatbot para la Agencia Tributaria, que podría resolver dudas y agilizar gestiones fiscales y un sistema para mejorar el diagnóstico temprano de insuficiencias cardíacas en Atención Primaria. Estas iniciativas buscan demostrar el potencial de ALIA para optimizar servicios públicos y mejorar la calidad de vida de los ciudadanos.

ESMA EXIGE A EXCHANGES RETIRAR STABLECOINS NO CONFORMES CON MICA EN MARZO DE 2025

Además, el proyecto se enmarca dentro de la Estrategia de Inteligencia Artificial 2024 del Gobierno, que pretende posicionar a España como líder en el desarrollo de tecnologías de IA transparentes, responsables y al servicio de las personas. Sin embargo, las buenas intenciones chocan con las críticas recibidas por su bajo rendimiento y elevado coste.

Un entrenamiento de 10,2 millones de euros

El entrenamiento de ALIA ha supuesto una inversión inicial de 10,2 millones de euros, una cifra que ha generado un intenso debate. Críticos como Javi Lopez, CEO y creador de la IA, Magnific, señala que pese al gasto, el modelo no logra superar a otros ya existentes, como Llama 2 34b , desarrollado por Meta hace más de un año.

Según López, ALIA no es un modelo construido desde 0, como indican los desarrolladores de ALIA en su sitio web, sino que se trata de un modelo finetuning, mejorado y con base, en un modelo Llama de Meta. Según los benchmarks, ALIA muestra un rendimiento deficiente en tareas clave como la comprensión de lenguaje natural (NLI) y la generación de respuestas a preguntas (QA).

Un trabajo basado en Llama

Si ALIA y su IA hermana, Salamandra, fueran un trabajo inicial y totalmente original del BSC, quizá la comunidad perdonaría el bajo rendimiento de su modelo. Sin embargo, esto ha puesto al proyecto en la mira de la comunidad. El usuario @ramonteleco afirma que han utilizado el tokenizador de Llama para generar la estructura del modelo Salamandra y de ALIA.

Una afirmación que confirma por @luijait, entrenador y desarrollador de IA para el sector de ciberseguridad. Según @luijait, Salamandra está basado en el trabajo que hizo posible Llama 3. Si bien, el entrenamiento y todo el proceso se hizo desde 0, el uso de toda la infraestructura NeMO, de Nvidia; y Llama, de Meta, significa que BSC no ha desarrollado nada nuevo. Solo han usado una infraestructura y software ya existente para hacer este trabajo.

Esto se puede constatar también en el repositorio de Github de ALIA, donde podemos ver elementos de uso de Llama para desarrollar ALIA. En este caso, instrucciones para generar un modelo de IA con la estructura que hace posible el funcionamiento de Llama.

Un multilingüe que deja mucho que desear

Otro punto es que el entrenamiento de ALIA se realizó utilizando grandes cantidades de datos en múltiples idiomas, con un enfoque particular en las lenguas cooficiales de España. Sin embargo, los resultados no han sido los esperados. Usuarios del modelo en HuggingFace, donde la BSC presentó el modelo, han señalado que el modelo presenta dificultades para interpretar y generar texto de manera eficiente, tal como lo indica Cesar Martin, lo que limita su utilidad práctica.

También indican que el modelo suele alucinar de forma continúa generando datos sin utilidad. Esto último, fue relatado por el usuario @anaya3d, quien subió una interacción (donde dijo: Hola) con esta IA en la que se muestran datos sin sentido como respuesta.

Todas estas situaciones cuestionan el alto precio que ha costado su entrenamiento, frente a otros proyectos de IA existentes. Un ejemplo es DeepSeek V3, un modelo de IA creado por una compañía china, que ha puesto de forma totalmente open-source. DeepSeek V3 compite directamente contra ChatGPT-4o, uno de los mejores modelos de IA en la actualidad. ¿El coste de DeepSeek v3? 6 millones de dólares. Con ese presupuesto han generado un modelo muy superior, no solo en calidad sino en velocidad, compitiendo directamente con OpenAI y sus enormes presupuestos.

Preguntas sin respuestas

La controversia que ha generado ALIA no solo ha dañado la reputación del proyecto, sino que también ha puesto en tela de juicio la eficiencia de la inversión pública en tecnología. Para un gobierno que busca impulsar la innovación y la soberanía tecnológica, los resultados de ALIA son un duro golpe. Además, la negativa a publicar comparativas transparentes y la falta de respuestas ante las críticas han alimentado la desconfianza del público y de la comunidad tecnológica.

Sin embargo, no todo son malas noticias. ALIA representa un primer paso en el desarrollo de una IA pública y multilingüe en Europa, algo que podría sentar las bases para futuros avances. Aunque el modelo actual no cumple con las expectativas, las lecciones aprendidas podrían ser valiosas para futuros proyectos.

Comparte esto: