domingo, septiembre 22, 2024

Google Gemini puede arreglar el sesgo de género en Google Translate

Hoy en día, las reuniones de tecnología acaban siempre con nuevos casos de uso que pueden ser implementados gracias a la Generative AI - o GenAI -. En concreto Google Gemini es uno de esos "Frontier Model" de la lista de GenAI Multi-modales que pueden resolver problemas de lenguaje con facilidad, así que ... ¿por qué no resolver el Problema del Sesgo de Género en Google Translate con Google Gemini? Parece bastante evidente. Vamos a ver cómo lo podría realizar.

Para comenzar, vamos a comprobar cómo Google Traslate a día de hoy - 22 de Septiembre de 2024 - sigue teniendo el Sesgo de Género en sus traducciones. Basta con pedirle una traducción con tres términos con género indeterminado para ver cómo en su traducción elige las profesiones de hombres y las de mujeres.
Ahora vamos a resolverlo con Google Gemini. En este caso de forma muy sencilla. Vamos a buscar primero las palabras de género incierto, que esto es algo que Google Gemini puede hacer muy bien. Yo he probado con este Prompt que podéis ver aquí.

Figura 3: Prompt enviado a Google Gemini

Y la respuesta de Google Gemini es perfecta. Entiende muy bien qué es lo que tiene que hacer, como podéis ver en su respuesta.

Figura 4: Google Gemini entiende y explica el género indeterminado

Así que vamos a probarlo ahora con el caso anterior, para que veamos cómo lo resuelve, que a Google Translate parece que se le hace imposible resolverlo.

Figura 5: Resuelto el sesgo de género en la traducción

Es increíble que Google Gemini pueda resolver tan fácil esto como para que no lo implementen en Google Traslate. 

Consideraciones

Con la detección de los términos de género indeterminado se arregla una parte importante de la traducción sesgada, que es la de poder avisar a los usuarios de que hay palabras en las que se ha elegido un género por defecto. 

Esta solución no implica quitar el sesgo en el entrenamiento de Google Traslate, sino en lo que se llama poner "Lipstick on a pig", que es la misma solución que han propuesto los investigadores de Apple, y que es la misma que propuse yo en el año 2019: Avisar a quién usa el traductor y dejar que elija los géneros que conozca, o que sepa cuáles son indeterminados.


Y ahora, la pregunta es ... ¿por qué no solucionarlo? Google Gemini es un Frontier Model, es decir, de los "TOP" en la resolución de problemas de lenguaje. Éste es un claro problema de lenguaje que conlleva detectar palabras de género indeterminadas e identificarlas en el interfaz de usuario... ¿Cuál es el problema para  Google resuelva esto?


¡Saludos Malignos!

Autor: Chema Alonso (Contactar con Chema Alonso)  


3 comentarios:

Carlos dijo...

Los sesgos de género en el procesamiento del lenguaje natural no están causados por un "informático en el lado del mal" nunca mejor dicho, son el resultado de aplicar la inferencia sobre un modelo previamente entrenado con el contenido del lenguaje natural de la sociedad actual. Al igual que la RAE tiene que limitarse a recopilar lo que la sociedad refleja, no aceptando el lenguaje inclusivo, al no ser mayoritario en la sociedad, los sistemas de traducción también deben hacer lo mismo. No es su cruzada la eliminación del sesgo de género. Si la sociedad lo pretende eliminar, que posiblemente lo haga en el futuro (o no) tanto la RAE como los sistemas de PLN lo reflejarán, lo demás es un esfuerzo fútil, en mi opinión.

Chema Alonso dijo...

Carlos, una cosa son sesgos en el lenguaje natural, y otra muy diferente que esos se propaguen a un traductor por no haber hecho bien las cosas. Está mal, lo tienen que arreglar y lo pueden arreglar fácilmente. ¿Por qué no lo hacen? Por falta de presión. Así que si seguimos denunciando esto, lo arreglarán. Está mal no pedir que lo arreglen y ser condescendiente con una situación así. Te animo a que firmes tú también la solicitud. Un abrazo.

María dijo...

Soy filóloga también (anti ir pisando huevos/as), pero no hace falta ser lingüista para ver que esta reclamación sobre traducción automática es 100% legítima. Entre otros Ignacio Bosque (RAE), está online en pdf, buscable por "Ignacio Bosque visibilidad de la mujer". Cito: «Hay, efectivamente, s@xism0 en el ejemplo "Los directivos acudirán a la cena con sus mujeres" [...] Nadie considera controvertida la propuesta de extender la formación de pares morfológicos a los nombres de profesiones y cargos (ingeniero-ingeniera, etc.)».
El sesgo existe, sí hay casos legítimos y este lo es. Cierro citando a Eugen Coșeriu en 1981: «La lengua es y funciona para los hablantes y no para los lingüistas», lo más grande☺

Entrada destacada

Tu Latch "Hack Your Innovation Contest": Haz un PoC & Hack por 1.000 €

El pasado Telefónica Innovation Day 2024 lanzamos oficialmente el " Tu Latch Hack Your Innovation Contest " en el que repartimos ...

Entradas populares