Darío Gil, IBM Research: “Este año estará el primer modelo de inteligencia artificial en español con casos de uso”

El responsable del centro de investigación mundial es el valedor de la IA para hispanohablantes, que se alimentará con datos públicos, incluidos debates parlamentarios, y de “cualquiera que quiera aportar”

08 abr 2024 - 05:20CEST

El cerebro humano es la estructura natural más compleja del universo conocido, con 86.000 millones de neuronas que transmiten 1.000 impulsos por segundo. Imitar solo una parte de esa extraordinaria maquinaria biológica para aprender, entender y responder en el español que hablan más de 500 millones de personas es la monumental tarea encargada por el Gobierno y en la que se han embarcado el Barcelona Supercomputing Center (BSC) con su superordenador MareNostrum y la multinacional IBM, que pondrá a disposición del proyecto todo su potencial de programación, investigación e infraestructura mundial de inteligencia artificial.

Darío Gil, murciano criado en Madrid que este 2024 cumple 49 años, ha sido el principal valedor tecnológico de esta aventura como máximo responsable de la división mundial de investigación de IBM. Participa en esta entrevista poco después de firmar el acuerdo que dará lugar al primer gran modelo de lenguaje de inteligencia artificial nacido en español. Convencido de que este avance es exponencial y sólido ―”una revolución”, proclama―, apuesta por una arquitectura abierta y colaborativa donde quepa todo, desde las actas de sesiones parlamentarias hasta la Real Academia Española o cualquier universidad o colectivo hispanohablante. Calcula que el primer desarrollo se podrá mostrar este año.

Pregunta. ¿Por qué apuesta IBM por la inteligencia artificial en español?

Respuesta. Nuestro punto de vista sobre la inteligencia artificial nos permite alinearnos con la estrategia que tiene el Gobierno. Creemos firmemente que el futuro de la inteligencia artificial se va a crear y definir a través de un ecosistema abierto y eso contrasta con otras empresas. Sucedió con los sistemas operativos hace más de 20 años y se hizo bien en su momento. Fue una apuesta decidida para que el futuro de los sistemas operativos, tanto en supercomputación como para todos los sistemas distribuidos de internet y demás, estén basados en código abierto. Nosotros hemos llegado al mismo convencimiento y la comunidad quiere participar en la creación de la inteligencia artificial.

P. ¿Cómo será la participación?

R. Vamos a crear entornos colaborativos para desarrollar modelos fundacionales basados en código abierto donde haya transparencia en los datos que se van a utilizar para el preentrenamiento y una metodología. Es muy importante para incrementar la capacidad de los modelos de manera discreta y día a día. Los modelos fundacionales existentes necesitan de seis a nueve meses de preentrenamiento y sacan versiones una vez al año. Si nosotros tenemos un modelo base para toda la comunidad de desarrolladores, para todo el que quiera a añadir conocimiento o capacidades, vamos a trabajar conjuntamente para crear los mejores modelos fundacionales abiertos en español y las lenguas cooficiales.

Si hay burbuja es de catastrofistas, pero la base tecnológica de la inteligencia artificial es potente y sólida

P. Cómo se va a desarrollar?

R. Desde el punto de vista de computación, utilizaremos las capacidades existentes en el BSC. Con su MareNostrum hay un compromiso del ministro [para la Transición Digital, José Luis Escrivá] de seguir invirtiendo para acelerar el paso del MareNostrum 5 al 6. Por nuestra parte, aportamos centros de supercomputación dedicados a inteligencia artificial y los últimos avances de IBM Research.

P. ¿Cuáles son los sectores prioritarios a los que va dirigido el modelo?

R. A todos, pero el Gobierno tiene interés en garantizar que se beneficie la pequeña y mediana empresa, donde hay mayor inhibición o complejidad a la hora de adoptar ese tipo de innovaciones, y la Administración del Estado. Hemos definido casos de uso para implementar la difusión de la inteligencia artificial en estos dos sectores.

El modelo utilizará datos públicos, pero hay un deseo de utilizar documentos que son propiedad del Estado, que es una cuestión muy singular e interesante. Las transcripciones de todos los debates del Parlamento es un ejemplo

P. ¿Cuánto cuesta?

R. No hay una respuesta concreta. Pero, si sirve para hacer una aproximación, puedo decir que para crear un modelo fundacional de alto rendimiento se necesitan miles de unidades de procesamiento que cuestan, cada una, 35.000 dólares [32.300 euros] como mínimo. Son proyectos muy ambiciosos; esto no es dos personas que hablan una tarde y hacen un PowerPoint. En IBM Research tenemos 3.600 científicos e ingenieros que participarán y nuestros propios equipos de supercomputación dedicados exclusivamente a crear modelos fundacionales. Y, como es un sistema abierto, habría que sumar la comunidad de desarrolladores hispanohablantes que quieran participar. Son esfuerzos que van en paralelo.

P. ¿De dónde saldrán los datos para alimentar el modelo?

R. Serán datos públicos, pero hay un deseo de utilizar documentos que son propiedad del Estado, que es una cuestión muy singular e interesante. Las transcripciones de todos los debates del parlamento es un ejemplo. Pero también se prevé la colaboración de las bibliotecas nacionales y la Real Academia Española. Serán datos que son públicos.

Al modelo le puedes pedir respuestas consistentes con la experiencia argentina y se comportará de esa manera, aprenderá del contexto desde donde se genera la interacción

P. ¿Y cómo se salva la diversidad de hablas del español?

R. Desde el punto de vista matemático, se pueden incorporar una gran diversidad de idiomas. La diversidad está dentro de la misma red neuronal y luego, cuando se hace el fine tuning [ajuste o perfeccionamiento], se adapta, aunque se haya entrenado con los documentos base, a las diferentes variaciones del español. Al modelo le puedes pedir respuestas consistentes con la experiencia argentina y se comportará de esa manera, aprenderá del contexto desde donde se genera la interacción.

P. Pero “coger una cita” en castellano puede no tener el mismo significado en algunos países de Hispanoamérica, por poner un ejemplo para un caso de uso administrativo.

R. El modelo base aumentará, se especializará y ganará habilidades con el esfuerzo de todos para que entienda contextos específicos. El modelo de código abierto permite esa enorme diversidad. Y el objetivo es expandirlo lo más posible, incluso a Brasil. Iberoamérica es un mercado enorme de oportunidades y es importante aprovechar la ventaja competitiva del español.

El objetivo es expandirlo lo más posible, incluso a Brasil. Iberoamérica es un mercado enorme de oportunidades y es importante aprovechar la ventaja competitiva del español

P. ¿Cuándo estará disponible el primer modelo?

R. El objetivo es hacer algo este año y, en paralelo, desarrollar algunos casos de uso en las mismas fechas. En este mundo [de la inteligencia artificial], que es muy dinámico, a nadie le interesan los plazos de años.

P. ¿Y qué gana IBM?

R. Pondré el ejemplo de Red Hat [multinacional de programación de código abierto cuya empresa matriz es IBM]. Factura miles de millones de dólares anuales y es la mayor empresa del mundo de software abierto. El modelo es facilitar el programa a empresas y gobiernos que, luego, querrán mantenimiento o seguridad compatible con los equipos. A ese modelo comercial estamos acostumbrados. No lo hacemos porque seamos altruistas, sino porque creemos en ese modelo. Queremos socios estratégicos y hemos encontrado muchísimas resonancias en el Gobierno de España. En la alianza de inteligencia artificial que tenemos hay más de 80 instituciones que forman parte de este compromiso.

P. ¿Hay burbuja de la inteligencia artificial?

R. La tecnología en sí está evolucionando a una velocidad como nunca he visto hacerlo a ninguna otra. Y ya no planificamos a un año o dos, sino para dentro de un mes, semanas o días. No veo burbuja. Si la hay es de catastrofistas, pero la base tecnológica es potente y sólida.

Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.

Tu suscripción se está usando en otro dispositivo

¿Quieres añadir otro usuario a tu suscripción?

Añadir usuario Continuar leyendo aquí

Si continúas leyendo en este dispositivo, no se podrá leer en el otro.

¿Por qué estás viendo esto?

Flecha

Tu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.

Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.

En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.

Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.

Sobre la firma

Raúl Limón

Licenciado en Ciencias de la Información por la Universidad Complutense, máster en Periodismo Digital por la Universidad Autónoma de Madrid y con formación en EEUU, es redactor de la sección de Ciencia. Colabora en televisión, ha escrito dos libros (uno de ellos Premio Lorca) y fue distinguido con el galardón a la Difusión en la Era Digital.