¿Cómo trata Google el meta noindex? -- Round 3

Publicado el 16 de marzo del 2013 by

Hoy voy a tratar de enterder cómo funciona Google con el meta noindex. Según Google este meta noindex es tratado de la siguiente manera

Si Google detecta una metaetiqueta "noindex" en una página, elimina la página por completo de los resultados de búsqueda, incluso en el caso de que otras páginas enlacen con ella. Sin embargo, otros motores de búsqueda pueden interpretar esta directiva de forma distinta. Como consecuencia, es posible que todavía aparezca un enlace en sus resultados de búsqueda.

Según las palabras de Google esta url de este artículo nunca debería aparecer en sus serps, por muchos links que esta URL reciba...

Esto es lo lógico, pero Sergio Simarro comentó un caso en el que tenía duda. Pero en su caso también usa el robots.txt para restringir el acceso a Google a todo el site porque es nuevo y aún no estará terminado y no quiere que lo indexe.

Se ha dado cuenta de que si hace un site:sudominio.com sale la home sin descripción y nada más, pero si le da a "Mostrar resultados omitidos" le salen todas las URLs.

Creo que este problema viene de que Google sigue unos pasos para saber si tiene permiso o no para ver una URL y si tiene permiso que tipo de permiso. Google primero mira el robots.txt que lo que hace es impedir el acceso al bot de Google al conentenido de cualquier ulr que esté en él y luego si tiene acceso, y sólo si no se lo restringe el robots.txt va cargando la url. Este es el paso en el que se dará cuenta de que tiene un meta noindex y entonces no mostrará los resultados en sus serps. Pero si restringimos también por robots.txt como en su caso este tiene "preferencia" y por lo tanto Google nunca llegará a intentar cargar esa URL y por lo tanto no se dará cuenta de ese meta. Con esto ya tengo otro interesante experimento a realizar, gracias Sergio Smile

Ya hice algún experimento para ver cómo funcionaba el meta noindex, pero fue hace bastante tiempo y los resultados no han sido del todo relevantes. Recordemos aquel experimento

  • Desde una url con noindex escribíamos 4 palabras inventadas, además estas palabras eran links ya que en principio quería comprobar cómo trataba estos dos metas a la vez, algo muy común en muchos sites.

  • Si buscamos la primera KW, sale en las serps el dominio al que enlazamos con esa KW desde la url con noindex (cuenta el link que hay dentro de una url con meta noindex,follow 

  • No ocurre lo mismo para las otras KW, por las que no obtenemos ningún resultado

  • Si buscamos con el comando site:mecagoenlos.com no parece que indexe esa url 



También otra prueba parece indicar que no lo indexa, pero para asegurarnos vamos a volver a probar.

Nos inventamos una palabra, y veremos si la indexa. no será link ni nada, y la anotaré un par de veces. Por ejemplo ploalskoe, es nuestra keyword. La palabra ploalskoe hoy en día no arroja ningún resultado en las serps de Google. A ver qué ocurre en unos días.

Yo creo que no indexará esta URL ni ninguna KW que haya en ella, pero por si acaso vamos a probar, así que ya sabemos, nuestra palabrita es ploalskoe. ¿LLegará Google a indexarla?

Y como estamos de rebajas vamos a hacer dos tests en uno, voy a invetar otra KW y esta vez la pondré un link a otro site. Si Google consigue relacionar esta kw, ijanksepor, con la página a la cual enlaza será que sí que rastrea el contenido de la URL aunque lleve noindex, supongo que lo rastreará porque este meta no indica que no la rastree, sino que no la indexe y muestre en los resultados de Google, pero no dice nada de no rastrearla, así que lo hará verá el link y asociará esa KW con la web a la que enlaza... o eso creo!! todo se verá :)

 




Lea otros artículos de Meta etiqueta noindex

Últimos posts

Últimos comentarios


Resham Singh Mahal

Post: Experimento para comprobar la teoría del primer enlace

Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt