Publicado el 16 de marzo del 2013 by
Lino Uruñuela
Hoy voy a tratar de enterder cómo funciona Google con el meta noindex. Según Google este
meta noindex es tratado de la siguiente manera
Si Google detecta una metaetiqueta "noindex" en una página, elimina la
página por completo de los resultados de búsqueda, incluso en el caso de
que otras páginas enlacen con ella. Sin embargo, otros motores de
búsqueda pueden interpretar esta directiva de forma distinta. Como
consecuencia, es posible que todavía aparezca un enlace en sus
resultados de búsqueda.
|
Según las palabras de Google esta url de este artículo nunca debería
aparecer en sus serps, por muchos links que esta URL reciba...
Esto
es lo lógico, pero
Sergio Simarro comentó un caso en el que tenía duda.
Pero en su caso también usa el robots.txt para restringir el acceso a
Google a todo el site porque es nuevo y aún no estará terminado y no
quiere que lo indexe.
Se ha dado cuenta de que si hace un
site:sudominio.com sale la home sin descripción y nada más, pero si le
da a "Mostrar resultados omitidos" le salen todas las URLs.
Creo
que este problema viene de que Google sigue unos pasos para saber si
tiene permiso o no para ver una URL y si tiene permiso que tipo de
permiso. Google primero mira el robots.txt que lo que hace es impedir el
acceso al bot de Google al conentenido de cualquier ulr que esté en él y
luego si tiene acceso, y sólo si no se lo restringe el robots.txt va
cargando la url. Este es el paso en el que se dará cuenta de que tiene un
meta noindex y entonces no mostrará los resultados en sus serps. Pero
si restringimos también por robots.txt como en su caso este tiene
"preferencia" y por lo tanto Google nunca llegará a intentar cargar esa
URL y por lo tanto no se dará cuenta de ese meta. Con esto ya tengo otro interesante experimento a realizar, gracias Sergio
Ya hice algún experimento para ver cómo funcionaba el meta noindex, pero fue hace bastante tiempo y los resultados no han sido del todo relevantes. Recordemos aquel experimento
- Desde una url con noindex escribíamos 4 palabras inventadas, además estas palabras eran links ya que en principio quería comprobar cómo trataba estos dos metas a la vez, algo muy común en muchos sites.
- Si buscamos la primera KW, sale en las serps el dominio al que enlazamos con esa KW desde la url con noindex (cuenta el link que hay dentro de una url con meta noindex,follow
- No ocurre lo mismo para las otras KW, por las que no obtenemos ningún resultado
- Si buscamos con el comando site:mecagoenlos.com no parece que indexe esa url
También
otra prueba parece indicar que no lo indexa, pero para asegurarnos vamos a volver a probar.
Nos inventamos una palabra, y veremos si la indexa. no será link ni nada, y la anotaré un par de veces. Por ejemplo ploalskoe, es nuestra keyword. La palabra ploalskoe hoy en día no arroja ningún resultado en las serps de Google. A ver qué ocurre en unos días.
Yo creo que no indexará esta URL ni ninguna KW que haya en ella, pero por si acaso vamos a probar, así que ya sabemos, nuestra palabrita es ploalskoe. ¿LLegará Google a indexarla?
Y como estamos de rebajas vamos a hacer dos tests en uno, voy a invetar otra KW y esta vez la pondré un link a otro site. Si Google consigue relacionar esta kw,
ijanksepor, con la página a la cual enlaza será que sí que rastrea el contenido de la URL aunque lleve noindex, supongo que lo rastreará porque este meta no indica que no la rastree, sino que no la indexe y muestre en los resultados de Google, pero no dice nada de no rastrearla, así que lo hará verá el link y asociará esa KW con la web a la que enlaza... o eso creo!! todo se verá :)