¿Cómo trata Google el meta noindex? -- Round 3

Publicado el 16 de marzo del 2013 by Lino Uruñuela

Hoy voy a tratar de enterder cómo funciona Google con el meta noindex. Según Google este meta noindex es tratado de la siguiente manera

Si Google detecta una metaetiqueta "noindex" en una página, elimina la página por completo de los resultados de búsqueda, incluso en el caso de que otras páginas enlacen con ella. Sin embargo, otros motores de búsqueda pueden interpretar esta directiva de forma distinta. Como consecuencia, es posible que todavía aparezca un enlace en sus resultados de búsqueda.

Según las palabras de Google esta url de este artículo nunca debería aparecer en sus serps, por muchos links que esta URL reciba...

Esto es lo lógico, pero Sergio Simarro comentó un caso en el que tenía duda. Pero en su caso también usa el robots.txt para restringir el acceso a Google a todo el site porque es nuevo y aún no estará terminado y no quiere que lo indexe.

Se ha dado cuenta de que si hace un site:sudominio.com sale la home sin descripción y nada más, pero si le da a "Mostrar resultados omitidos" le salen todas las URLs.

Creo que este problema viene de que Google sigue unos pasos para saber si tiene permiso o no para ver una URL y si tiene permiso que tipo de permiso. Google primero mira el robots.txt que lo que hace es impedir el acceso al bot de Google al conentenido de cualquier ulr que esté en él y luego si tiene acceso, y sólo si no se lo restringe el robots.txt va cargando la url. Este es el paso en el que se dará cuenta de que tiene un meta noindex y entonces no mostrará los resultados en sus serps. Pero si restringimos también por robots.txt como en su caso este tiene "preferencia" y por lo tanto Google nunca llegará a intentar cargar esa URL y por lo tanto no se dará cuenta de ese meta. Con esto ya tengo otro interesante experimento a realizar, gracias Sergio

Ya hice algún experimento para ver cómo funcionaba el meta noindex, pero fue hace bastante tiempo y los resultados no han sido del todo relevantes. Recordemos aquel experimento

Desde una url con noindex escribíamos 4 palabras inventadas, además estas palabras eran links ya que en principio quería comprobar cómo trataba estos dos metas a la vez, algo muy común en muchos sites.
Si buscamos la primera KW, sale en las serps el dominio al que enlazamos con esa KW desde la url con noindex (cuenta el link que hay dentro de una url con meta noindex,follow
No ocurre lo mismo para las otras KW, por las que no obtenemos ningún resultado
Si buscamos con el comando site:mecagoenlos.com no parece que indexe esa url

También otra prueba parece indicar que no lo indexa, pero para asegurarnos vamos a volver a probar.

Nos inventamos una palabra, y veremos si la indexa. no será link ni nada, y la anotaré un par de veces. Por ejemplo ploalskoe, es nuestra keyword. La palabra ploalskoe hoy en día no arroja ningún resultado en las serps de Google. A ver qué ocurre en unos días.

Yo creo que no indexará esta URL ni ninguna KW que haya en ella, pero por si acaso vamos a probar, así que ya sabemos, nuestra palabrita es ploalskoe. ¿LLegará Google a indexarla?

Y como estamos de rebajas vamos a hacer dos tests en uno, voy a invetar otra KW y esta vez la pondré un link a otro site. Si Google consigue relacionar esta kw, ijanksepor, con la página a la cual enlaza será que sí que rastrea el contenido de la URL aunque lleve noindex, supongo que lo rastreará porque este meta no indica que no la rastree, sino que no la indexe y muestre en los resultados de Google, pero no dice nada de no rastrearla, así que lo hará verá el link y asociará esa KW con la web a la que enlaza... o eso creo!! todo se verá :)

Comentar