¿Repartiendo el long tail?

Publicado el 29 de septiembre del 2009

Desde ayer se están viendo un número muy elevado en el número de resultados de páginas indexadas de muchos dominios cuando haces la búsqueda site:dominio.com . Creo que todo apunta a que tiene que ver con Google caffeine.

Decía que estaba actualizando la estructura de sus índices, para que estos fuesen mucho mayores y más rápidos.

Creo además que con este cambio veremos un gran cambio en el algoritmo que clasifica el orden de los resultados, como puede ser links el que ignore algunos wide-links (links en todas las URLs de un dominio), resultados más geolocalizados para determinadas temáticas y cosas como estas para intentar hacer menos manipulables sus resultados.

Yo creo que el cambio de algoritmo que llevará a cabo Google se irá viendo poco a poco, lo primero que ha hecho ha sido modificar su infraestructura para poder acometer estas mejoras a la hora de mostrar resutados.

Antaño, si se me permite este expresión para hace menos de 2 años, existía lo que llamábamos índice suplementario. Era un índice en el que estaban las URLs que menos veces se mostraban como posibles resultados y que para que saliesen se tenía que haber hecho una búsqueda que no tuviera muchos resultados, por ejemplo con frases largas, o con algún truquito (poniendo por ejemplo site:mecagoenlos.com *** -patatinpatatan).

En su día nos dijeron que ese índice iba a actualizarse diariamente para luego decirnos que iba a desaparecer, y de repente dejaron de funcionar esos truquitos para ver si una URL estaba o no en el índice supementario, pero yo creo que en realidad nunca dejó de existir.

Ahora creo que el índice general será mucho más amplio, y además, tendrá capacidad para aplicar determinados filtros para evitar spam.

Creo que esto conllevará a que por los términos de long tail haya muchas más URLs que compitan, y no como antes, que había determinadas URLs que tenían ventaja sobre otras al estar en ese índice principal. Por eso, creo que páginas con gran tráfico por long tail pueden verse perjudicadas si esta actualización fuese como digo.

La verdad es que puedo estar muy confundido y no ser nada así, esto es como la teología, si Dios no nos dice nada, crearemos nuestras propias teorías para intentar explicar lo que vemos. Lo bueno es que podremos comprobarlo en un espacio de tiempo cercano... y sin tener que morirnos!


 


Dani Pinillos (@)hace Hace más de 15 años y 96 días

Joder Lino la has clavao.

Siguiendo tu lógica que tiene mucho sentido creo que pronto veremos algo gordo que esta pasando.

Es cierto que el índice nunca ha dejado de existir, de hecho según recuerdo Google no comento que desapareciera físicamente sino que se dejaría de ver.

Tiene mucha lógica porque esta indexando contenidos duplicados que antes entraban en el suplementario.

Bueno en breve tendremos que ver las consecuencias de la cafeina, mas vale que yo deje el café hace años y tomo té, jajaja ;-)

Saludos!

Errioxa (@)hace Hace más de 15 años y 96 días

@Dani el té tiene teina! no sé que será peor jajaja.
Ya te digo que a saber que es lo que se cuece, esto podría ser una consecuencia de ello, pero eso... a saber!

José Kontreras (@)hace Hace más de 15 años y 96 días

Yo creo que con eso al menos el SEO se volvería más interesante que solo optimizar para aparecer en la cola larga, ya que entonces si se tendría lo que llamamos "Posicionamiento" XD

Por cierto q para una web q tenia 2000 resultados en el indice ayer que ustedes comentaban esto, revise y ahora tiene 6000!

Slds desde Guatemala!

Dani Pinillos (@)hace Hace más de 15 años y 96 días

Jajaja por eso pero a Google le gusta el café y no el té al menos por ahora.

Has podido comprobar si indexa urls duplicadas o con variables largas o cosas raras que antes se comía el índice suplementario? Voy a mirarlo ;-)

Por cierto como comenta @elqudsi en Google images también esta afectando y están de baile por la cafeína.

Pedro Serrano (@)hace Hace más de 15 años y 96 días

Hola Errioxa!
Más que cuánto, la pregunta es qué está indexando Google. En función de qué sea lo que esté indexando, tendrá sentido tu afirmación de que va a afectar al longtail.
Es decir, si todo ese contenido que se está indexando es duplicado ¿porqué debería afectar al longtail?
En cambio, si el contenido indexado es gracias a que google puede navegar a través de js. y está accediendo a la web invisible, sí que es posible que afecte al longtail.
Por cierto, a ver si me aceptas como follower tuyo en twitter (pserrano) ;)

emma (@)hace Hace más de 14 años y 244 días

Dani Pinillos: Y el té no lleva cafeína?



Lea otros artículos de Google Updates

Últimos posts

Últimos comentarios


Rhetachasp

Post: Experimento para comprobar la teoría del primer enlace

Resham Singh Mahal

Post: Experimento para comprobar la teoría del primer enlace

Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt