lunes, noviembre 11, 2019

LEIA: Lengua Española e Inteligencia Artificial

Este viernes se presentó ante los medios en el XVI Congreso de la Asociación de Academias de la Lengua Española, el Proyecto LEIA (Lengua Española e Inteligencia Artificial) en el que Telefónica, LUCA, mi equipo de Ideas Locas y yo personalmente hemos estado implicados para conseguir que saliera adelante. Mucho se ha escrito ya, y tenéis información en la nota de prensa que sacamos en Telefónica y en el artículo del Blog Think Big sobre LEIA.

Figura 1: LEIA: Lengua Española e Inteligencia Artificial

Ahora os voy a contar yo solo algunos detalles más sobre todo lo que se ha dicho, porque seguro que me van a preguntar mucho al respecto. Así que, aprovecho, y me voy al pasado, a una reunión con im jefe en la que me dijo: 
"Os voy a decir algo que al principio a lo mejor no os gusta mucho, pero que luego sí. Así que escucha, que nos vamos a Argentina después del Mobile World Congress, en concreto a Buenos Aires, y a Córdoba". 
Así da el jefe las noticias que continúan con mucho trabajo. Y así fue. Lo primero que pensé cuando me dijo que le había preguntado a D. Santiago Muñoz Machado, presidente de la RAE, si tenían información de cuántas máquinas hablarían español, y si estaban haciendo algo como tener un sillón en la RAE para la Inteligencia Artificial, fue que me iba a tocar trabajar. Seguro. No me libraba.

Figura 2: Foto del acto de presentación de LEIA en el congreso de este viernes

Yo ya había tocado el tema de los correctores ortográficos que no reconocen los términos del Diccionario de la Real Academia de la Lengua Española muchas veces, y hasta había hecho una inocentada en el año 2017 hablando de ese tema. Diciendo que la RAE me daba un taburete a mí para hablar de estas cosas y que mucha gente se creyó. La verdad es que lo que decía ahí en la mayoría de los puntos eran pensamientos míos que había debatido con amigos muchas veces.

Figura 3: Vocablos correctos de baja frecuencia

Si Word, Gmail, o Facebook, marcan como incorrecto (con el subrayado rojo) un término que es correcto pero no es muy común su uso, la gente deja de utilizarlos, por lo tanto se reduce la riqueza lingüística porque la gente deja de utilizar ese término. Al reducirse la riqueza lingüística se ven afectadas la literatura, la música, el cine, y las comunicaciones entre empresas. Y nos afecta como sociedades. 

Figura 4: Vocablos no reconocidos tras pasar el diccionario de la RAE por Google Docs y MS Word

Lo mismo sucede si un error de alta frecuencia se viraliza. La lengua sufre modificaciones no controladas que son mediatizadas por malas implementaciones tecnológicas y no por una evolución coherente de sus hablantes. Así que hay que controlar que la tecnología haga buen uso de nuestra lengua. Por ejemplo, el editor de Blogger que estoy usando ahora mismo, no reconoce términos como: viraliza, biometría, cognitivo o vespino.


Figura 5: Charla impartida en Córdoba sobre IA y Lengua Española

Así que senté a mi equipo de Ideas Locas, y preparamos unas demos. Pasamos el diccionario entero por Gmail y por Word. Hicimos unas skills & actions para Alexa y Google Home que no hacían buen uso de la lengua (algo que pasa con cientos de skills de todo tipo de electrodomésticos), buscamos límites en los servicios cognitivos de reconocimiento de sentimiento - algo que implica tener un reconocimiento complejo de todas las acepciones de un término léxico - y preparamos una charla.


Esa charla complementaría la que haría nuestro Presidente D. José María Álvarez Pallete, y que dimos primero en Telefónica, luego en la Real Academia de la Lengua donde me tiré esa fotaca con mi admirado Arturo Pérez Reverte, y después en Cordoba, Argentina. Y aquella charla terminaba con una petición de nuestro jefe a todos los académicos de aquel congreso. Que pensaran en ello y crearan un sillón para la Inteligencia Artificial en la RAE.

Figura 7: Petición de que la RAE creara el sillón de la IA. Al final se lo darían a LEIA.

Desde aquel mes de Marzo, puse a trabajar a mi equipo de LUCA, por medio de nuestro compañero el Dr. Richard Benjamins que es el "Chief Big Data & AI Ambassdor" de Telefónica, que ha estado trabajando codo a codo con los equipos de la RAE para el proyecto que él mismo propuso bautizar como LEIA (Lengua Española e Inteligencia Artificial) del que hoy estamos hablando.

Figura 8: D. Santiago Muñoz Machado presentando empresas en LEIA

El resto ya es historia pública. Contamos el proyecto a Microsoft y Google que se sumaron ipso-facto. Y empezamos a trabajar. Microsoft ha estado creando con Plain Concepts un addon para Office chulísimo que permite consultar el diccionario y la base de datos de preguntas hechas para tener una experiencia creando documentos en Word mucho más acorde con las normativas de nuestra lengua, tal y como presenta Héctor Sánchez Montenegro en el vídeo que podéis ver.


Figura 9: Presentación de LEIA

Google, Amazon y Facebook se han sumado con integraciones con el diccionario y con el firme compromiso de hacer un uso más acertado de los mecanismos de corrección lingüística en todas las herramientas tecnológicas, no solo las que hacen uso de la voz.


Figura 10: Presentación de LEIA por empresas tecnológicas

Y nosotros, pues lo mismo. Hacemos uso de las servicios cognitivos en Microsoft con lo que colaboremos en lo que esté en nuestra mano en la mejora de ellos en español, pero además incluiremos las herramientas de RAE para mejorar el conocimiento de nuestra lengua, además de ayudarles a construir más herramientas a partir de sus bases de datos de conocimiento.


Figura 11: Entrevista en RNE sobre LEIA

Y eso es todo, un proyecto que comenzó como una locura y que Santiago Muñoz Machado ha llevado hasta la firma de las principales empresas tecnológicas y ha unido a todas las Academias de la Lengua Española una vez más para luchar porque los hispanohablantes tengamos un mejor futuro en este Siglo XXI invadido por la tecnología que hace uso del lenguaje natural.

Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)

1 comentario: