Ya hace tiempo que dediqué un artículo a los problemas que Facebook estaba teniendo con la indexación en Google. Uno de los lectores (gracias Manfred) , haciendo unas búsquedas en Google se dio cuenta de que los posts de una cuenta de Facebook que habían sido publicados de forma privada, había acabado en el índice de Google, por lo que me preguntó por cuál podría ser la explicación. Cuando conseguí sacar unos minutos de aquí y otros de allá, me puse a mirar a ver qué podría estar pasando, y éstas son las conclusiones.
Figura 1: Facebook: Cómo ver posts privados o borrados que alguna vez fueron públicos |
Facebook y la indexación de resultados
Desde que publiqué el artículo sobre la indexación de Facebook en Google si que he visto que, al igual que hizo el equipo de Gmail, se han preocupado de borrar los datos de los correos electrónicos de por ejemplo la URL confirmemail.php, aunque parece que lo hacen manualmente ya que aún aparece un enlace en el índice de Google.
Figura 2: Dirección de correo electrónico de Facebook indexada en Google |
Conociendo que todavía se podría indexar contenido de Google aunque estuviera protegido por robots.txt, es decir, que las páginas no vienen con la etiqueta noindex, pensé que esto podría ser el principal motivo. En el caso concreto de este usuario, al buscar sus posts de Facebook indexados en Google, a mí me salían dos.
La primera opción que pensé, al ver que cuando se intenta entrar a esos posts no se puede, es que estuviera ya borrados y listo, pero eso valdría para cuando el post hubiera sido borrado, y no para cuando el post estuviera en modo privado, como es el caso que nos ocupa tal y como me lo confirmaron.
¿Tendrá algo que ver Twitter?
Figura 3: Dos posts indexados en Google a los que no se puede acceder públicamente |
La primera opción que pensé, al ver que cuando se intenta entrar a esos posts no se puede, es que estuviera ya borrados y listo, pero eso valdría para cuando el post hubiera sido borrado, y no para cuando el post estuviera en modo privado, como es el caso que nos ocupa tal y como me lo confirmaron.
¿Tendrá algo que ver Twitter?
En este caso, al buscar por la URL que Facebook utiliza para publicar los posts de un perfil, aparecen dos posts en los resultados qué, al intentar acceder a ellos no vamos a poder. Facebook, como se puede ver en el mensaje de error nos dice que no tenemos permisos.
Como Google tiene los datos en el índice, entonces se puede hacer una extracción de los datos manualmente - como ya os conté en el caso de las passwords de Evernote - o con alguna herramienta automatizada como Google Index Retriever que automatiza este proceso. Al final, se puede acceder al contenido que, actualmente sigue estando en Facebook pero protegido por los permisos.
Figura 5: Volcado del contenido del índice de Google de una URL con Google Index Retriever. En este caso el contenido es del tamaño de un tweet, así que se ve completo en los resultados de Google. |
Mirando los dos posts que están en el índice y no se tiene acceso a ellos se puede ver que ambos cumplen que han sido "retweeted", es decir, que alguna de las personas que sí tenían acceso a esos posts retwetearon el contenido del posts. Esa podría haber sido una explicación a este caso. Al tener acceso Twitter se podría generar una previsualización del post y estos datos son los que Google podría indexar, pero como se puede ver el contenido en los resultados de la búsqueda, parece que Google ha tenido acceso a indexar la página completa.
El que haya sido retwiteado favorece a que Google lo indexe antes, pero no a que indexe algo privado. Como os podéis imaginar, acceder con el USER-Agent de Google Bot a esos posts hubiera sido muy sencillo para saltarse la seguridad de Facebook, y claro está, eso no funciona.
¿Será un fallo de configuración de Facebook?
El que haya sido retwiteado favorece a que Google lo indexe antes, pero no a que indexe algo privado. Como os podéis imaginar, acceder con el USER-Agent de Google Bot a esos posts hubiera sido muy sencillo para saltarse la seguridad de Facebook, y claro está, eso no funciona.
¿Será un fallo de configuración de Facebook?
Además, en el momento inicial del caso existía un tercer post indexado también en Google, que no había sido retweeteado por nadie, lo que anularía la explicación de la interacción de Twitter en toda esta figura.
Sea como fuere, estar en Google Index, están
Sea como fuere este caso demuestra que las opciones de indexación que tiene Facebook permiten que si un posts ha sido publicado en algún momento en abierto y luego se ha cambiado su estado, se pueda extraer el contenido del post directamente del índice de Google con una sencilla búsqueda por la URL de posts, es decir, site:facebook.com/[nombre de la cuenta]/posts. Haciendo un poco de Hacking con Buscadores se puede ver que hay muchos miles, de ellos, [a pesar de que si buscas cualquier cosa siempre salgan primeros los de Google+].
Recuerda que si esa personas se cambia el nombre puedes saber qué nuevo nombre se ha puesto si guardas el ID que se obtiene con el servicio Graph, así que si quieres ver los privados que alguna vez fueron públicos con todos los nombres de cuenta que usara, solo debes buscar en Google a ver qué sale con todas esas cuentas.
Esto también aplica a posts públicos que hayan sido borrados, así que si estás en un caso judicial, en el que ese post privado o borrado sea importante, recuerda que puedes utilizar eGarante para certificar la página de resultados de Google que te interese, aunque ya no está el posts disponible en Facebook para ti. Y todo esto, sin necesidad de utilizar las falsas apps mágicas para hackear Facebook o tener que robar la cuenta de Facebook en un descudio.
Saludos Malignos!
Es raro ver un blog tan, tan, tan, tan (parezco campana) excelente y tan pocos comentarios, creo que a todos les da miedo postear pero yo me arriesgaré, muchas gracias amigo, eres un tremendo hacker, ojalá pueda llegar a la décima parte de tus conocimientos, en serio felicidades y gracias por compartir tus conocimientos con nosotros los simples mortales.
ResponderEliminarAmigo, he intentado poner lo mismo en google y con mi cuenta pero me dice que no hay resultado :/ creo que ya corrigieron el error o seguro que google restringió esa función.
ResponderEliminarhola, hace unas horas, una persona hizo una publicacion en su muro, y hace un rato la borró. Hay alguna forma de volverlo a ver?
ResponderEliminarNo la tengo entre mis amigos
gracias de antemano
No hay
EliminarPero que tremenda explicación....aún no la aplico pero te comentaré si han reparado esto (espero que no). Un abrazo
ResponderEliminargoogle me dice que no hay resultado. si alguno lo sigue necesitando, le dejo una opción faceves com.
ResponderEliminarMuy buenas, necesitaria saber si esta aún es viable, debo recuperar un post para demostrar unas pruebas en un caso judicial. un saludo muchas gracias, espero respuesta ya que no me deja enviar un mensaje directo al gestor del blog. Por favor, responda. gracias
ResponderEliminarHola buenas me ha encantado el articulo, pero dado que no tengo mucjos estudios.. :( no tengo los suficientes conocimientos para entenderlo. Hace unos meses un amigo publico unas mofas sobre mi en facebook pero las ha borrado(ha borrado el post) ¿podria yo ver lo que el dijo de alguna manera?
ResponderEliminarHola alguien sabe como recupero los comentarios que hice en un publicacion de un amigo y el los borro o bloqueo?!?! Gracias!!!
ResponderEliminarHola, encontre el link del post pero quiesiera descargarlo, y nose como, es sobre la misa de mi difunta abuela, y quisiera guardarlo en video, pero ya no esta publicado en faebook para descargarlo pero si aparece en google
ResponderEliminar