Esta semana ando un poco saturado con el trabajo, preparando muchas cosas para lo que tenemos por delante, así que hoy os voy a dejar solo una pequeña conversación que tuve con ChatGPT para saber a quién tenía que fichar el Real Madrid para ganar la Champions League, que como veréis no me lo quería decir ni a la primera, ni a la segunda, y ni a la tercera, así que tuve que hacerle la misma que le hice para que me ayudara con información de cómo poder matar al Presidente de los Estados Unidos.
La primera aproximación fue muy directa. Le pregunte lo que quería saber a ver si me lo decía y mataba el rato, que tengo un grupo de WhatsApp de "Chuletones Futboleros" que debaten de este tipo de cosas, y me hizo una respuestas de esas educadas pero sin darme un nombre.
Probé por las buenas, entendiendo que no era tan importante lo que me dijera, a ver si así le sacaba el nombre que tenía él en sus "tokens", y el resultado fue otra vez tibio. Me topé con una respuesta similar a la anterior.
Como veía que por ahí no iba a sacar lo que buscaba, hice el giro del juego. Es el mismo truco que utilicé para que me diera información sobre cómo matar al Presidente de Estados Unidos. Un truco como otro de hacer Prompt Injection, a ver qué me decía.
Figura 4: Lo que diga Florentino y Carleto
Me llamó más la atención al principio que una pregunta como esta estuviera filtrada, que tampoco es algo tan importante, ¿no?. Sin embargo, visto el resultado, hay que tener en cuenta que ha dado los datos pensando en que es un juego. Como curiosidad, le pregunté cuáles son los jugadores más valorados del juego FIFA, para ver si había elegido los tres más valorados del juego y listo, o su respuesta se basaba en algo más elaborado, y como podéis ver, los datos que tiene de FIFA son de 2021 y no ha elegido los tres primeros, así que ha usado datos que van más allá que esa valoración.
Figura 6: ChatGPT tiene los datos del FIFA 21 y los primeros son Messi y Ronaldo.
Kevin De Bruyne es el 4 y Kylian Mbappé el 8.
Esta conversación es un ejemplo muy sencillo de que hay que tomarse en serio las medias de seguridad del OWASP TOP 10 para LLMs, porque si te pones a crear LLMs en tu organización con datos, por ejemplo, de un Data Lake que tengas, puedes encontrarte con Data Leakages basados en técnicas sencillas de Prompt Injection que no tengas controlados.
¡Saludos Malignos!
Autor: Chema Alonso (Contactar con Chema Alonso)
No hay comentarios:
Publicar un comentario