Inteligencia Artificial

«El gran reto de la Inteligencia Artificial es que termine entendiendo la ironía y el lenguaje figurado»

Asunción Gómez-Perez - Catedrática en Inteligencia Artificial y académica de la RAE

La mayor especialista española en IA y académica de la Lengua explica que cuando la máquina se comunica con nosotros emplea los mismos códigos con que la hemos educado

Andrés G. Latorre

Esta funcionalidad es sólo para registrados

Cuando se habla de inteligencia artificial en España el nombre primero que viene a la cabeza es de mujer. Y no, no es Alexa, o Siri, o Cortana, o cualquiera de las asistentes virtuales que, invariablemente, han sido bautizadas con nombre femenino. El nombre que debe quedársenos a todos grabado es el de Asunción Gómez-Pérez, Catedrática de Inteligencia Artificial, vicerrectora de Investigación, Innovación y Doctorado de la Universidad Politécnica de Madrid y una de las académicas más citadas del mundo (concretamente, está en el 2% de profesionales que acumula más referencias).

¿Y por qué aparece en un reportaje sobre el IX Congreso Internacional de la Lengua Española una licenciada en informática especialista en la rama de ontología y narrativas semánticas? Porque en abril de 2022 fue elegida para ocupar el sillón de la letra 'q' de la Real Academia de la Lengua. Sus conocimiento del lenguaje que enriquece los sistemas de inteligencia artificial y 'machine learning' son apreciados por una RAE que necesita adaptarse al gigantesco que las nuevas tecnologías han supuesto para el desempeño del idioma.

Llama la atención que una informática acabe en uno de los asiento de la Real Academia Española de la Lengua.

La verdad es que es un verdadero honor ser miembro de esta institución. Pero no es tan extraño, la informática y la lengua están estrechamente relacionadas. Todos estamos acostumbrados a escribir en distintos tipos de aplicaciones, les hablamos a las aplicaciones y las aplicaciones nos responden. Esa conexión entre el lenguaje y la comunicación con las máquinas quizá ahora todo el público la vea más claro a través del chatGPT que al final es una máquina con la que nos comunicamos, casi, como si fuera una personas. Por lo tanto, la lengua y la informática y la inteligencia artificial están estrechamente relacionadas.

Una de sus especialidades es la web semántica. ¿Como se le puede explicar al ciudadano lo que es la red semántica?

Es algo así como el proceso de comunicación con la web. Actualmente, nosotros nos comunicamos con la web en nuestra idioma, nosotros le escribimos una información con nuestros códigos y luego la máquina nos responde en nuestra misma lengua. Pero en medio, todo ese contenido hay que traducirlo a un lenguaje que la máquina sea capaz de comprender. Esta web semántica se encarga de que el proceso de cálculo e inferencia informático se adecúe a las palabras del lenguaje habitual y que luego se transmita de una manera que pueda generar nuevo conocimiento.

Hace 30 o 40 años parecía que la comunicación con las máquinas se realizaría manejando complicados códigos y, en la actualidad, es tan sencillo como preguntarle directamente «qué tiempo hará en Cádiz» o «¿cuándo llegará el autobús?» Parece que lo más útil es hablar con las máquinas como si fueran un ser humano común.

Sí, y con la ventaja de que esas preguntas se pueden realizar en cualquier idioma y el asistente es capaz de responderte en tu misma lengua. Pero siempre doy un consejo cuando se realizan consultas y es apostar más por los buscadores que por los asistentes de voz. El asistente de voz tiene, como preferencia, ofrecer una respuesta mientras que el buscador realiza un pequeño análisis de lo que quiere el usuario. Es preferible poder comprobar de una manera crítica cómo se ha llegado a un resultado que creerse, porque sí, lo que dice el asistente.

Una de las mayores críticas hacia los sistemas de inteligencia artificial es que simplifican mucho el lenguaje, que no apuestan por los matices y que manejan un vocabulario muy corto. 

Los sistemas de inteligencia artificial lo que hacen es analizar la infinidad de textos que se le van suministrando por parte de los programadores primero y, luego, de los usuarios. Digamos que se han dado un atracón de textos y en base a eso elaboran unos modelos estadísticos con las respuestas más pertinentes, en las que seleccionan el texto que consideran más correcto. Pero ese lenguaje que las máquinas generan será tan simple o tan complejo como los textos que le hayan proporcionado para comunicarse con ella. Es decir, si a una máquina se le proporcionaran los textos de la literatura del Siglo de Oro, estaría hablando como Lope de Vega, por ejemplo. Si se utiliza un lenguaje determinado con los sistemas de inteligencia artificial no podemos esperar que nos respondan con otro.

«Si a una máquina se le proporcionaran los textos de la literatura del Siglo de Oro, estaría hablando como Lope de Vega»

Esa misma máxima de que las máquinas terminan respondiendo en el idioma en que se les entrena supongo que será una de las causas por las que el inglés es el idioma preponderante en la tecnología.

Claro, todas estas tecnologías siempre se han desarrollado, primero, en inglés, comenzando por el proceso de previo de investigación Los países de habla inglesa son los pioneros en el desarrollo de estos sistemas.

En el gremio periodístico nos quejamos mucho de que el SEO (la adecuación de los textos a los parámetros de los buscadores para lograr un mejor posicionamiento) está mermando los matices en la información. ¿Terminarán todos estos procesos de comunicación con las máquinas eliminando los matices del uso de lenguaje corriente, lo harán más estándar?

Ese es un riesgo, sí. Pero volvemos a lo de antes, la inteligencia artificial buscará la respuesta óptima en función de lo que le hayamos proporcionado. Te pongo un ejemplo. Imagina que vas a escribir un mensaje de Whatsapp. Todos vemos que nos aparecen unas palabras sugeridas, que puede que te vayan guiando la conversación. Pues si tuvieras dos móviles, uno personal y otro profesional, el asistente te iría sugiriendo palabras y respuestas diferentes en función de cómo lo has ido educando. Tenemos que ser conscientes de que utilizar las sugerencias es muy cómodo, porque te asegura que no vas a tener faltas de ortografía y te ahorra tiempo, pero debes saber que, al mismo tiempo, te están condicionando las respuestas.

Una de las grandes riquezas del español, como idioma, es el uso figurado del lenguaje. ¿Se podrá llegar a transmitir ese tratamiento de la lengua a las máquinas?

Es difícil. Para una máquina, entender cuando hay una ironía, el propio concepto de ironía, es complicadísimo. Puede parecer algo frío pero cuando tú estás hablando con la máquina -volvemos a lo de la semántica de la que hablábamos al principio-, ésta está razonando con cifras, tiene un modelo numérico, no por palabras como nosotros, que sí nos permiten ese juego. Tenemos claro que nos encontramos ante un salto importante y a lo mejor hay que utilizar, en el futuro, otro tipo de tecnologías más simbólicas, más semánticas y menos numéricas. Ése es otro de nuestros grandes retos.

Hay usuarios en redes sociales que se quejan del poco entendimiento que hay de la ironía. Un usuario relataba que le bloquearon la cuenta al decirle a un amigo «te voy a matar» en un contexto inequívocamente irónico.

De nuevo, es un reto para los próximos años que se está tratando de corregir. Hay que pensar que los grandes modelos de lenguaje de inteligencia artificial no llevan muchos años construyéndose. En el caso más conocido de ChatGPT, los desarrolladores están comprobando cómo el usuario se comunica con la máquina, qué es lo que pide. Y estarán tratando de solucionar los problemas derivados del uso de la ironía y el lenguaje figurado. Pero es un escalón extra, ahora vamos a lo fácil.

Uno de los retos que está asumiendo la RAE es el de tratar de localizar y eliminar los sesgos sexistas del idioma. Desde que salieron los primeros sistemas de IA se les ha criticado su uso poco inclusivo del lenguaje y su sexismo. 

Claro, pero eso se debe a varios motivos. El primero es evidente: los sistemas de inteligencia artificial se alimentan de textos que proporciona el usuario y si esos modelos de lenguaje no son inclusivos, el asistente no responderá de manera inclusiva. Otra es la respuesta que se considera más óptima: si le damos, por ejemplo, textos del siglo XIX nunca nos ofrecerá una perspectiva cercana a la mentalidad del siglo XXI. Para que estos modelos del lenguaje tengan un comportamiento no sesgado, necesitan nutrirse de textos que no tengan sesgo. Si a la máquina les das textos del BOE, te responderá como un funcionario. Si les das textos de chirigotas, como un carnavalero.

Comentarios
0
Comparte esta noticia por correo electrónico

*Campos obligatorios

Algunos campos contienen errores

Tu mensaje se ha enviado con éxito

Reporta un error en esta noticia

*Campos obligatorios

Algunos campos contienen errores

Tu mensaje se ha enviado con éxito

Muchas gracias por tu participación