Nota: Este artículo fue una "Inocentada" del 28 de Diciembre. Todo lo que se cuenta en él es cierto, a excepción de la carta y la invitación para ser un Taburete de la RAE. Gracias a todos por los mensajes y, especialmente, a los que os pareció una noticia auténtica ya que eso significa cosas positivas para mí.
Todo comenzó el pasado
1 de marzo de 2017, cuando poco antes de hablar de
AURA asistí a la presentación del libro “
El valor Económico del Español”. Allí tuve la suerte de escuchar al gran
Mario Vargas Llosa hablado de la importancia del
Español en nuestro mundo, en la economía de hoy en día y en la futura. Pero yo tenía alguna que otra queja.
|
Figura 1: La Real Academia de la Lengua me invita a ser miembro de la institución |
Aproveché para reunirme con algunos académicos de la
RAE, y les conté algunas de mis preocupaciones sobre dicho tema. Básicamente, mi problema es que, la tecnología que crean las grandes empresas anglosajonas, nos está manipulando y redefiniendo el
Español para hacerlo más pobre y menos diferente con su propia lengua, que argumente con una serie de motivos que os paso a enumerar.
1) Si no hay palabra bien definida, se usa la versión anglosajona: No hace falta que os diga que les saqué mi caballo de batalla personal con el término hacker, al que creía que la RAE había incluido en el diccionario con una definición que no era para nada la que nosotros entendíamos, por eso nunca íbamos a utilizar “pirata informático”. Seguiríamos utilizando Hacker con su definición anglosajona, y eso resta valor e importancia al diccionario, que es una de nuestras herramientas más poderosa.
|
Figura 2: Definición de Hacker en inglés en el IETF |
2) El Español de baja frecuencia: Cuando analizamos los sistemas de reconocimiento de términos que se utilizan en las tecnologías de las grandes empresas de tecnología, es pésimo. Basta hacer una pequeña prueba con palabras esdrújulas, menos utilizadas ampliamente por la mayoría de los hispano parlantes en la red, y darse cuenta como los sistemas correctores dan por malas una cantidad enorme de ellas.
|
Figura 3: En rojo términos no reconocidos por el corrector de Google |
Esto es simplemente porque son palabras de baja frecuencia, es decir, que no están en la gran mayoría de los sistemas correctores que utiliza el software más popular de Microsoft, Google o Apple. Basta con ver el ejemplo.
3) Los errores de alta frecuencia: No hace falta decir que muchos usuarios utilizan el buscador de Google para ver si una palabra está bien escrita o mal escrita. Su criterio es, que si Google le dice que hay muchos resultados, entonces está bien. Y eso no es siempre así. Casos como cuando se utiliza el imperativo más el pronombre para dar una orden y se cambia por el infinitivo. Para la gente es una cuestión de cuántas referencias salen.
|
Figura 4: Resultados con "poneos". |
Es cierto que ambas son formas válidas, pero depende del contexto y el uso. No es lo mismo un “Deberíais poneros a estudiar” que un “Dejar de hablar y poneos a estudiar”. Por desgracia, la elección de muchos visitantes es el mero número de resultados.
|
Figura 5: Resultados con "poneros". Se come al infinitivo. |
4) Los acentos hablados: Con la construcción de AURA, nosotros estamos dotando a nuestras tecnologías de tecnologías “Cogntive”. Es decir, de interfaces humanos como el reconocimiento natural del habla o la visión artificial. Cuando vamos a ver cómo funcionan los reconocimientos naturales del habla, tenemos un problema mayor con los acentos y dejes locales, ya que el Español de baja frecuencia ya no es solo en su forma escrita, si no en su forma hablada, por lo que el número de términos que perdemos es mayor. Así, un acento gaditano de Español hablando a un sistema NLP de tecnologías Microsoft o Google, tiene dos problemas. O bien no reconoce muchas de las palabras o bien el usuario debe modificar su acentuación, y por tanto perder la riqueza que ella lleva.
Además, harían falta sistemas de
AI basados en el lenguaje
Español. A día de hoy, ninguna empresa tecnológica anglosajona propone servicios cognitive que te digan, por ejemplo, el significado del término en frase o la probabilidad de procedencia del interlocutor.
Con escuchar hablar a un catalán, a un gallego (de
Galicia), a un porteño, un chileno, o un sevillano, es posible para muchos de nosotros reconocerlo. Bien por el acento, bien por el significado de las palabras en las expresiones, bien por las referencias locales. Esto, a día de hoy no existe en los sistemas de AI que ofrecen servicios "
cognitivos" y perdemos una ventaja de posicionamiento en el futuro.
Por último, mi preocupación era sobre qué pasa con las otras formas de representación del
Español, por medio de cosas como los
Emojis o el lenguaje
leet, u otros que van apareciendo en la red. Esto ya sucedió con los mensajes
SMS(esmés) en el pasado, pero ahora hay muchas formas de representación.
|
Figura 6: Un "Ole tus huevos, campeón" en Emoji |
Con este debate pasamos un rato interesante, e incluso conseguí que me dijeran que iban a ver cómo
solucionaban lo del término hacker – algo que por cierto ya han resuelto -. Lo que no pensaba yo es que mi idea terminara cuajando y me ofrecieran a mí ser miembro de la
RAE, por medio de la carta que me enviaron hace poco más de un mes, y que os he colgado en
SlideShare.
La verdad es que después de que
me eligieran uno de los 100 españoles más influyentes del año, de recibir la
Cruz del mérito con distintivo blanco de la Guardia Civil, este ha sido el colofón perfecto para el año. Así que, como tenía hasta fin de año para decidirme, he dicho que sí, y a partir de ahora no volveré a escribir ningún término en inglés en mi bitácora y la despedida tendrá también su signo de admiración a la apertura de la frase.
¡Saludos Malignos!
¿Y tu letra será la arroba?
ResponderEliminarEste comentario ha sido eliminado por el autor.
ResponderEliminarEl "taburete de la arroba" es tuyo, sin duda. Soy un lector desde hace años y, después de don APR, eres para mi el mejor escritor. La palabra es mas poderosa que la espada. ¡Caña de España! O:)
ResponderEliminar¡Grande, Chema!
ResponderEliminarDesde siempre he sido una defensora de lo que ahora has tomado como decisión... en mi caso seguro que es más porque no hablo/escribo en inglés, pero, en cualquier caso, ¡bienvenida sea!
Muchísimas felicidades por todo y un gran año para ti.
Curradísima inocentada, sí señor. Mi dies.
ResponderEliminar¿Te has currado así de bien esta inocentada? Porque si es así estaría bien que a partir del 29 siguieras con la práctica :-)
ResponderEliminarEste comentario ha sido eliminado por el autor.
ResponderEliminarEste comentario ha sido eliminado por el autor.
ResponderEliminarUfffffff... Mira que te has puesto en serio a elaborarlo... Jajajajaaaaapi28dic
ResponderEliminarTe lo has currado ... me pregunto si esta es una de las tuyas! Ya que no es un buen día para publicar estas noticias! Un abrazo.
ResponderEliminarEs de lo mejor que he leído a lo largo del día, jajjaja
ResponderEliminarGrande Chema, grande!
¡Ahora a hackear el español! :) ¡Felicitaciones!
ResponderEliminar¡Genio Chema! Chinchin por muchos logros mas!
ResponderEliminarAbrazos desde Argentina
P.D.: No entendí ni un comentario anterior jaja Qué es "currado? jaja
Este comentario ha sido eliminado por el autor.
EliminarBueno bueno, estás que te sales. Enhorabuena.
ResponderEliminarenhorabuena!!, la bomba, qué interesante
ResponderEliminar