jueves, diciembre 28, 2017

La Real Academia de la Lengua me invita a ser miembro de la institución @RAEInforma

Nota: Este artículo fue una "Inocentada" del 28 de Diciembre. Todo lo que se cuenta en él es cierto, a excepción de la carta y la invitación para ser un Taburete de la RAE. Gracias a todos por los mensajes y, especialmente, a los que os pareció una noticia auténtica ya que eso significa cosas positivas para mí.

Todo comenzó el pasado 1 de marzo de 2017, cuando poco antes de hablar de AURA asistí a la presentación del libro “El valor Económico del Español”. Allí tuve la suerte de escuchar al gran Mario Vargas Llosa hablado de la importancia del Español en nuestro mundo, en la economía de hoy en día y en la futura. Pero yo tenía alguna que otra queja.

Figura 1: La Real Academia de la Lengua me invita a ser miembro de la institución

Aproveché para reunirme con algunos académicos de la RAE, y les conté algunas de mis preocupaciones sobre dicho tema. Básicamente, mi problema es que, la tecnología que crean las grandes empresas anglosajonas, nos está manipulando y redefiniendo el Español para hacerlo más pobre y menos diferente con su propia lengua, que argumente con una serie de motivos que os paso a enumerar.
1) Si no hay palabra bien definida, se usa la versión anglosajona: No hace falta que os diga que les saqué mi caballo de batalla personal con el término hacker, al que creía que la RAE había incluido en el diccionario con una definición que no era para nada la que nosotros entendíamos, por eso nunca íbamos a utilizar “pirata informático”. Seguiríamos utilizando Hacker con su definición anglosajona, y eso resta valor e importancia al diccionario, que es una de nuestras herramientas más poderosa.
Figura 2: Definición de Hacker en inglés en el IETF
2) El Español de baja frecuencia: Cuando analizamos los sistemas de reconocimiento de términos que se utilizan en las tecnologías de las grandes empresas de tecnología, es pésimo. Basta hacer una pequeña prueba con palabras esdrújulas, menos utilizadas ampliamente por la mayoría de los hispano parlantes en la red, y darse cuenta como los sistemas correctores dan por malas una cantidad enorme de ellas.
Figura 3: En rojo términos no reconocidos por el corrector de Google
Esto es simplemente porque son palabras de baja frecuencia, es decir, que no están en la gran mayoría de los sistemas correctores que utiliza el software más popular de Microsoft, Google o Apple. Basta con ver el ejemplo.
3) Los errores de alta frecuencia: No hace falta decir que muchos usuarios utilizan el buscador de Google para ver si una palabra está bien escrita o mal escrita. Su criterio es, que si Google le dice que hay muchos resultados, entonces está bien. Y eso no es siempre así. Casos como cuando se utiliza el imperativo más el pronombre para dar una orden y se cambia por el infinitivo. Para la gente es una cuestión de cuántas referencias salen.
Figura 4: Resultados con "poneos".

Es cierto que ambas son formas válidas, pero depende del contexto y el uso. No es lo mismo un “Deberíais poneros a estudiar” que un “Dejar de hablar y poneos a estudiar”. Por desgracia, la elección de muchos visitantes es el mero número de resultados.


Figura 5: Resultados con "poneros". Se come al infinitivo.
4) Los acentos hablados: Con la construcción de AURA, nosotros estamos dotando a nuestras tecnologías de tecnologías “Cogntive”. Es decir, de interfaces humanos como el reconocimiento natural del habla o la visión artificial. Cuando vamos a ver cómo funcionan los reconocimientos naturales del habla, tenemos un problema mayor con los acentos y dejes locales, ya que el Español de baja frecuencia ya no es solo en su forma escrita, si no en su forma hablada, por lo que el número de términos que perdemos es mayor. Así, un acento gaditano de Español hablando a un sistema NLP de tecnologías Microsoft o Google, tiene dos problemas. O bien no reconoce muchas de las palabras o bien el usuario debe modificar su acentuación, y por tanto perder la riqueza que ella lleva.
Además, harían falta sistemas de AI basados en el lenguaje Español. A día de hoy, ninguna empresa tecnológica anglosajona propone servicios cognitive que te digan, por ejemplo, el significado del término en frase o la probabilidad de procedencia del interlocutor.

Con escuchar hablar a un catalán, a un gallego (de Galicia), a un porteño, un chileno, o un sevillano, es posible para muchos de nosotros reconocerlo. Bien por el acento, bien por el significado de las palabras en las expresiones, bien por las referencias locales. Esto, a día de hoy no existe en los sistemas de AI que ofrecen servicios "cognitivos" y perdemos una ventaja de posicionamiento en el futuro.

Por último, mi preocupación era sobre qué pasa con las otras formas de representación del Español, por medio de cosas como los Emojis o el lenguaje leet, u otros que van apareciendo en la red. Esto ya sucedió con los mensajes SMS(esmés) en el pasado, pero ahora hay muchas formas de representación.

Figura 6: Un "Ole tus huevos, campeón" en Emoji

Con este debate pasamos un rato interesante, e incluso conseguí que me dijeran que iban a ver cómo solucionaban lo del término hacker – algo que por cierto ya han resuelto -. Lo que no pensaba yo es que mi idea terminara cuajando y me ofrecieran a mí ser miembro de la RAE, por medio de la carta que me enviaron hace poco más de un mes, y que os he colgado en SlideShare.

La verdad es que después de que me eligieran uno de los 100 españoles más influyentes del año, de recibir la Cruz del mérito con distintivo blanco de la Guardia Civil, este ha sido el colofón perfecto para el año. Así que, como tenía hasta fin de año para decidirme, he dicho que sí, y a partir de ahora no volveré a escribir ningún término en inglés en mi bitácora y la despedida tendrá también su signo de admiración a la apertura de la frase.

¡Saludos Malignos!

16 comentarios:

Unknown dijo...

¿Y tu letra será la arroba?

Unknown dijo...
Este comentario ha sido eliminado por el autor.
anso dijo...

El "taburete de la arroba" es tuyo, sin duda. Soy un lector desde hace años y, después de don APR, eres para mi el mejor escritor. La palabra es mas poderosa que la espada. ¡Caña de España! O:)

Pilar Arguiñáriz Lusarreta - Palel dijo...

¡Grande, Chema!
Desde siempre he sido una defensora de lo que ahora has tomado como decisión... en mi caso seguro que es más porque no hablo/escribo en inglés, pero, en cualquier caso, ¡bienvenida sea!
Muchísimas felicidades por todo y un gran año para ti.

Carlos M. Pérez dijo...

Curradísima inocentada, sí señor. Mi dies.

Pilar Arguiñáriz Lusarreta - Palel dijo...

¿Te has currado así de bien esta inocentada? Porque si es así estaría bien que a partir del 29 siguieras con la práctica :-)

Unknown dijo...
Este comentario ha sido eliminado por el autor.
Unknown dijo...
Este comentario ha sido eliminado por el autor.
pirucho dijo...

Ufffffff... Mira que te has puesto en serio a elaborarlo... Jajajajaaaaapi28dic

David Romero Trejo dijo...

Te lo has currado ... me pregunto si esta es una de las tuyas! Ya que no es un buen día para publicar estas noticias! Un abrazo.

José María Acuña Morgado dijo...

Es de lo mejor que he leído a lo largo del día, jajjaja
Grande Chema, grande!

Luchostein dijo...

¡Ahora a hackear el español! :) ¡Felicitaciones!

Lolita dijo...

¡Genio Chema! Chinchin por muchos logros mas!
Abrazos desde Argentina

P.D.: No entendí ni un comentario anterior jaja Qué es "currado? jaja

Unknown dijo...
Este comentario ha sido eliminado por el autor.
Antonio dijo...

Bueno bueno, estás que te sales. Enhorabuena.

isabelfuentesbueso dijo...

enhorabuena!!, la bomba, qué interesante

Entrada destacada

Cibercriminales con Inteligencia Artificial: Una charla para estudiantes en la Zaragoza

Hoy domingo toca ir a participar en un evento, con una charla y una pequeña demo. Ahora mismo sí, así que el tiempo apremia, os dejo una cha...

Entradas populares