Otra prueba para el meta canonical

Publicado el 22 de abril del 2012, by Lino Uruñuela

El otro día intentamos ver de que manera Google podría valorar el meta canonical, y de momento podemos pensar en las siguientes conclusiones:

  1. Google traspasa el valor de los links que apuntaban a una página con el meta canonical, al igual que hace con las redirecciones 301, o al menos de forma muy similar

  2. Google no guarda caché de la página que tiene el meta canonical (página canonizada)

  3. Google no cuenta los enlaces que hay en una página canonizada

  4. Google no muestra resultados para palabras que están en la página canonizada (palabras inventadas)


Como creo que esto es un tema muy importante vamos a seguir haciendo unas cuantas pruebas, a ver cómo responde Google.


Esta vez vamos a enlazar desde aquí, ksuerzoaw, a la página la cual acabo de poner el meta canonical hacia otra URL de este mismo dominio. Google debería traspasar el valor del enlace y mostrar la URL a la que apunta el canonical. Estas dos URL son viejas, del año 2008, y ya estaba indexada por Google.

La URL que tiene el meta canonical también contiene un par de links que enlazan hacia una tercera página externa. Si buscamos la frase entre comillas del primer link veremos en estos momentos (22 abril) como se posiciona la página de destino de ese link (clavesde punto com). Lleva posicionada para esa búsqueda desde el 2008, yo creo que dejará de estarlo en unos días. 


 

caballitos de mar



 

Ya que es temporada futbolera voy a hacer mi porra, supongo que irá igual que el anterior, la prueba es la misma sólo varía el que la URL donde he añadido el meta y la URL a la que apunta son viejas y ya estaban indexadas.

  • Google dejará de mostrar el dominio clavesde para esta búsqueda.
    Ya que no contará los links que están dentro de una URL que tenga meta canonical. ¿Se desperdician?

  • Google dejará de mostrar la propia página que contiene la frase del link y el meta canonical para esa búsqueda. Nos quedaremos sin resultados para ese término. Google no guardará el texto que hay en una URL con canonical ni lo asociará a la página de destino donde apunta el meta.

  • Google mostrará la página de destino donde apunta el meta canonical para esta nueva búsqueda con la KW ksuerzoaw .
    El canonical sí traspasará a la página de destino el valor de los enlaces entrantes que tenga una página canonizada.

  • Google mostrará la caché de la página de destino al mirar la caché de la página canonizada.
    Para dos URLs tendremos la misma caché, la de la página de destino.


Muchos sites grandes tiene la práctica de usar bastante el meta canonical, por ejemplo para ponerlo en todas las páginaciones hacia la página 1, con la intención de darle todo el peso a la primera página. Pero podría ser que de esta forma estuviéramos desperdiciando todos los enlaces internos/externos que tenemos en las paginaciones, si como creemos, Google no valora esos links.

Y no solo desperdiciaríamos los links internos y externos que tengamos en estas páginas sino que también perderíamos el texto que hay en ellas y al perder el texto también perderíamos combinaciones long tail por las cuales se posicionaba debido a la coincidencia de términos con lo que habia buscado el usuario. Si poneos el canonical sólo optaremos a combinaciones con el texto que hay en la primera página de resultados. 

 

¿Se os ocurren más maneras de comprobar de que manera Google trata los links que hay en una página con meta canonical?


Si esto fuese así,
  • ¿sería un error poner canonical en paginaciones?
    Ahora optaría claramente en poner el meta prev y next.

  • ¿Cuál sería la mejor manera para evitar contenido de baja calidad en determinados filtros?
    Pensemos por ejemplo en filtros de rangos de precios o filtros por código postal, filtros que normalmente yo prefiero no indexar. Siempre había pensado en dos opciones, restringir el paso a Google (desde robots.txt o meta noindex) o poner el canonical. Parecía que el canonical era una buena idea, no indexabas el contenido, y le dabas "algo" de valor a la URL que tú querías, pero parece ser que no le traspasábamos ningún valor Frown, bueno sí, el de los links que recibiese.

  • ¿Usarías el meta canonical para las ordenaciones de los resultados de la misma URL?
    Por ejemplo ordenar tu listado por precio por ejemplo.
    Creo que aquí sí sería una buena aplicación ya que el texto será el mismo y así pasas el valor de los enlaces. Además el canonical se creo justamente para esto.

 

  ACTUALIZACIÓN: (21 May 2012)

 

Gracias al SEO Duque que me comentó el otro día que no siempre ocurre esto, por ejemplo si hacemos esta búsqueda vemos como el primer resultado es una URL que tiene el meta canonical.

¿Por qué en una web ocurre una cosa y en otra funciona de otra manera?
Podría ser por la autoridad de la URL, o porque la estén enviando en un sitemap... algo habrá, vamos a intentar descubrir el por qué en los próximos experimentos SEO?

 



 


jordi (@)hace Hace más de 12 años y 246 días

Hola,
Muy buenos artículos relacionados con el tag canonical.
Entiendo que si se quiere usar el canonical en una página, uno de sus fines es que la página no se indexe.
Para que Google tenga en cuenta los enlaces internos de la página que posee el canonical, creéis que añadiendo un meta robots="NoIndex, FOLLOW" se solucionaría?
O creéis que las dos sentencias en el código (canonical y Noindex,Follow) no darán este efecto y que precederá una de las dos?

Errioxa (@)hace Hace más de 12 años y 246 días

@Jordi habrá que probarlo. Pero hoy no que ya 3 posts en un día van a ser muchos :p

Yo creo que se quedará con el meta canonical e ignorará el resto.

Errioxa (@)hace Hace más de 12 años y 240 días

Ahora ha pillado la caché como si hubiesen enviado un comentario en este form.

Así que desde robots.txt he restringido el acceso al parámetro ?mail= de la URL, aunque me he dado cuenta que poniendo los parámetros también le pongo canonical, así que debería actuar de la misma manera.

Javier Lorente (@)hace Hace más de 12 años y 217 días

El canonical en las cabeceras se comporta mejor que en el código, es más fácil colárselo cuando el contenido no es idéntico, por ejemplo para filtros de un mismo listado como has dicho.

daniel bermúdez (@)hace Hace más de 12 años y 216 días

el link hacia la búsqueda (en la actualización) no aparece ya en los resultados de búsqueda... habrá que replantearse el uso de estos, aunque claro esta es la función, eliminar la importancia de la página que lo tenga frente al resto de urls.



Lea otros artículos de Links y experimentos

Últimos posts

Últimos comentarios


Resham Singh Mahal

Post: Experimento para comprobar la teoría del primer enlace

Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt