Cómo borrar páginas del índice de Google

En determinados casos ocurre que por deteminadas causas quieres hacer desaparecer una URL del índice de Google, ya sea porque el contenido se ha quedado anticuado, ya sea porque tienes más de una página igual y podrían penalizarte o por protección de datos. Antes había que poner en el archivo robots.txt que no te indexará esa URL, y en la propia página era recomendable una serie de pasos como poner el metatag  content="nocache".

Ahora Google pone al servicio de los webmasters una opción para borrar estas páginas de forma muy detallada diciendole por qué estás borrando esa página, si quieres borrar un directorio o si quieres borrar todo el dominio.

Pone la condición de que la URL que quieras borrar deberá tener una de las siguientes cosas:

Para páginas individuales

  1. La URL debe dar una respuesta de error 404
  2. LA URL debe estar boqueda desde el robots.txt
  3. La URL debe estar con el metatag <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Una vez hecho esto puede enviar la solicitud a Google.

Para directorios enteros

  1. En este caso deberás obligatoriamente remarcarlo en el robots.txt
    User-agent: Googlebot
    Disallow: /miDirectorio

Una vez hecho esto puede enviar la solicitud a Google.

Para dominios enteros

  1. También deberás modificar tu robots.txt
    User-agent: Googlebot
    Disallow: /

Cuando hagas una solicitud, te marcará el estado de ésta, y cuando haya sido aceptada los contenidos elejidos serán borrados del índice de Google así como su caché.

Avisa que para bajas por la publicación de datos personales o confidenciales es mejor escribiles un email desde Google Sitemaps para tratar el caso con la atención que requiera.

La herramienta parece bastante amplia, así que habrá que probarla y sacar conclusiones.

 




Lea otros artículos de Links y experimentos

Últimos posts

Últimos comentarios


Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt

María
Hola Lino, tengo el mismo problema. El probador de robots de google me indica: "Error al obtener el archivo robots.txt Tienes un archivo ro
Post: Errores críticos originados por el robots.txt