Hoy sábado os voy a dejar uno de los dos retos de Captchas Cognitivos con los que estoy jugando con mis amigos. No parecen muy difíciles, pero tienen su miga. Lo que hay que conseguir es un script automático que usando un LLM con Computer Vision y Reasoning sea capaz de romper esta protección de forma efectiva.
Para ello, hay que conseguir resolver la mayoría de los captchas a la primera petición de validación que se haga. Cuando juguéis un rato con este, luego os publico la solución que hemos encontrado nosotros. Y si os ha entretenido, hago lo mismo con el otro, que es muy más complejo pero a la vez mucho más entretenido y divertido.
Reto 1: Captchas Visuales
El primero es un captcha visual muy sencillo. Luego os diré en qué plataforma se utiliza, pero es un reto que parece muy sencillo, y sin embargo no lo es tanto. Os dejo tres muestras que GPT4-Vision y GPT4o no lo resuelven a la primera.
Y si vemos algunos ejemplos de cómo pidiéndoselo a GPT4-Vision y a GPT4o no somos capaces de resolverlos a la primera.
Si lo consigues automatizar, como en los ejemplos que ya os he ido contando, déjame la explicación en los comentarios, o mándame un artículo con la solución directamente a mi buzón de MyPublicInbox y te lo publico. Aquí tenéis algunos ejemplos de qué es lo que buscamos.
- ReCaptchav2 de Google con Cognitive Services
- Captcha Cognitivo de Twitter (X) con GPT4-Vision & Gemini
- Captcha Cognitivo de Twitter (X) con Anthropic Claude 3.0 Opus
- Captcha Cognitivo de Twitter (X) con GPT-4o
- Captcha Cognitivo de Administración Pública con ChatGPT
- Captcha Cognitivo de la mano y la plancha en HBO max
- Captcha Story X: I am not a Robot, I am a GenAI Multimodal Agent
¡Saludos Malignos!
Autor: Chema Alonso (Contactar con Chema Alonso)
Como mejor funciona es obligándole a centrarse en el interior de los caracteres y ayudándole con las posibles confusiones. Lamentablemente no es determinista y a veces no lo hace del todo bien. Seguro que alguien se anima a pulir el prompt (funciona, tengo el pantallazo de que va a la primera), yo es que salgo ya de viaje 😅
ResponderEliminarYou are a very special character recogniser, not looking at the edges and shadows or reflections of the edges, but at the white-coloured interior contained by those edges. For you, that's the character, nothing else. Only white characters. You will look for patterns and identify characters based on that. Be especially careful with the 1's and I's, as the I's (focusing in white interior) are just a white straight line with no ridges and the 1's are a white line with white ridges at obtuse angles. Be careful with the O's and 0's, the O's being rounder than the 0's. Now I need you to solve a captcha by isolating mentally the 4 characters, ignoring edges focusing in white interior and identifying them as I have described.
Saludos!