Datos incoherentes y cálculo de la posición media en Search Console

Publicado el lunes 29 de julio del 2019 por Lino Uruñuela



Hace muchos años que Google lanzó Search Console, aunque su nombre inicialmente fue Google Sitemaps, debido a que era su principal función. Más tarde se rebautizó como Google Webmaster Tools, ya que las funcionalidades que nos ofrecían eran ya bastante más que la de enviar un sitemaps, por ejemplo, el 5 de febrero del 2007 se añadió a la herramienta la funcionalidad para ver los enlaces entrantes tu site, algo que en su época era mucho más valioso que ahora, ya que el link exchange (intercambio de links) y la compra de links era el pan de cada día en el mundo SEO y tener la lista de los enlaces que Google te contabilizaba era un gran avance para el SEO.


Ese día, a las pocas de que lo lanzaran descubrí un bug que me permitió descargar TODOS los links externos hacia CUALQUIER dominio!. Fue solamente durante unas horas hasta que lo hice público en los foros de Dirson (ya no existen) y un rato después dejé un comentario en el blog de Matt Cutts explicando lo que ocurría.... 


Al cabo de un rato bloquearon el acceso a Webmaster Tools a todos los usuarios en todo el mundo.... la verdad que fue fácil, y además me dio la oportunidad de descargarme toneladas de enlaces externos que tenía mi competencia, para así luego poder ir añadiendo allá dónde ellos tuviesen y yo no, vamos casi casi como hoy en día.


A parte de esa anécdota, Search Console ha ido añadiendo funcionalidades, cambiando el diseño y ofreciendo herramientas para hacernos la vida un poco más fácil, o al menos, más entretenida.


Estos días voy a escribir una serie de artículos sobre el informe de rendimiento, a mi parecer posiblemente la herramienta más valiosa que hay en Search Console desde que Google Analytics nos dejó sin poder conocer las keywords por las que los usuarios llegaban a nuestra página.


Quiero compartir lo que he aprendido estos años sobre los datos que nos da la herramienta, sus carencias y por supuesto el cómo explotar esos datos, así que vamos a empezar por lo básico:


Métricas y Dimensiones

Supongo que más o menos estáis familiarizados con las dimensiones y métricas de Google Analytics así que yo me voy a saltar las explicaciones básicas que de eso ya hay mucho escrito.

Posición

La posición se contabiliza de arriba abajo, en dispositivos móviles no hay ninguna duda ya que solo existe una columna de resultados.


Posicion Google Search Console




Posicion Google Search Console 2



Debemos tener en cuenta alguna cosa:

  • Los resultados que están en el mismo bloque, por ejemplo el punto 2 de la primera imagen, tendrán todos la misma posición.
  • Si el resultado de tu web está oculto en ese bloque y hay que hacer scroll para verlo (punto 3 de la segunda imagen), no sumará una impresión hasta que el usuario haga scroll y vea el resultado de tu página, entonces tendrá una impresión, y si el usaurio hace click tendrá una impresión + un click.


Sin embargo en Desktop donde puede existir una segunda columna a la derecha con resultados "especiales" como el Knowledge Graph o los resultados My Business.

Posicion en Desktop



Existen otras excepciones como cuando un resultado es una búsqueda restringida de consulta (si haces clic en un enlace de los resultados de búsqueda y se efectúa una nueva consulta, se trata de una búsqueda restringida de consulta), más información sobre este punto en la documentación de Google Search Console.


Con la posición es muy tentador mirar la gráfica de evolución, para ver si sube o baja esa posición, pero si no la asociamos a un término de consulta exacto no nos dará información relevante porque es una media de todas las palabras en la que al menos ha habido una impresión.


Podría ser, y de hecho es muy habitual que si estás creciendo, cada vez tengas un mayor número de keywords que generan impresiones, y también clicks, por o que ya entrarán para el cálculo de la posición. Estos términos para los que estamos evolucionando nuestra posición posiblemente nos baje la media y pudiéramos creer que estamos perdiendo posiciones cuando en realidad las estaś ganando.


Tampoco es muy fiable el ver la gráfica para las consultas a las que se le aplica un filtro "que contenga", exactamente por la misma razón de antes, si antes solo te posicionabas por dos consultas "consulta 1" en la posición 1 y "consulta 2" en la posición 4, y ambas generan una impresión yun click, podríamos decir que posición para las keywords que contienen "consulta" es (1+4) ÷ 2= 2,5


Pero si estamos ganando posiciones para las consultas "consulta 3" en la posición 20 y "consulta 4" en la posición 10, obtendríamos una posición media = (1+4+20+10) ÷ 4 = 8,75 


Si no sabemos el número de palabras a las que hace referencia esa métrica es como estar ciegos.... y aun sabiendo el número de consultas a las que hace referencia tampoco nos daría información muy relevante, solamente nos valdría para dudar de ese dato.....


Sobre la posición creo que hay mucho desconocimiento de cómo se calcula, no solamente si es una búsqueda restringida de consulta o si solo contabiliza si hace scroll en los casos de bloque de resultados, sino en cómo se calcula la posición media para una consulta.

Cálculo de la posición media

En la documentación de Search Console, (últimamente la están actualizando cada poco tiempo añadiendo más detalles sobre de dónde salen los datos y porque determinadas incoherencias) tienen un error, mejor dicho, no detallan lo suficiente y genera interpretaciones erróneas de los datos por nuestra parte.

Si miramos lo que nos dice a la hora de calcular la posición, fijémonos en lo subrayado y en la posición media remarcada en rojo.


Cálculo de la posición media en Search Console


Pero aquí se está omitiendo cierta información muy importante, un poco más abajo, afinan un poco más.


Cálculo de la posición media en Search Console tabla


Como decía antes, no es erróneo, pero no ofrece toda la información, vamos a ver un ejemplo real



Media normal



Como veis no coincide con el dato que aparece en Search Console... ¿por qué? porque Google no realiza una media sin más, sino que realiza la media ponderada de las métricas posición e impresiones en este caso sería de la siguiente manera.


Media ponderada search console 3



Y aplicándolo a nuestros resultados:


Media ponderada search console



Ahora sí!!! vemos como los números, al menos en esto, cuadran

Como veis una misma Keyword puede aparecer un mismo día en diferentes posiciones, depende de muchas cosas, pero sobretodo de cuántas y qué dimensiones quieras mostrar. Este ejemplo es claro, para una misma KW ha salido 100 veces en la primera posición, 11 veces en la posición 10 (10 veces en desktop y 1 vez en tablet) ¿No deberíamos darle más peso en base a las impresiones? tiene toda la lógica....


Démonos cuenta de la importancia de saber calcular la posición cuando creamos vemos los datos en terceras herramientas como puede ser Data Studio, donde se debe calcular la posición media de esta manera si se han creado dashboards con métricas calculadas... lo mismo con otras herramientas que no pidan en tiempo real los datos a la API de Search Console, de la cual hablaremos de estos problemas mucho más a fondo y ya habiendo asimilado la chapa que os doy en este artículo.

Y para no hacer de esto un tocho de esos que se pusieron de moda con 6.000 palabras porque cuando veamos que existen datos agregados por página y datos agregados por propiedad la cosa se volverá a complicar..... pero eso para otro día.

Impresiones

Cuando una url aparece entre los 10 primeros resultados de la búsqueda, esta url que aparece sumará automáticamente una impresión para el término de búsqueda del usuario. Si el resultado de tu página aparece en la página dos de los resultados de Google, solo recibirá una impresión si el usuario navega hasta la página dos, si no no sumará esa impresión.... algo lógico :)


Clicks

Esta métrica que no necesita presentación... si un usuario hace click, se contabilizará ese click asociado a la url que aparece en los resultados y que el usuario ha hecho click. Para mi es la métrica Reina, un click es un usuario! y viendo la evolución de los clicks podrás ver tener una mejor idea de la evolución de tu proyecto.


Dimensiones

Las dimensiones de las que disponemos son

  • Consultas

    Representa las cadenas de consulta que han buscado los usuarios en Google, pero solo se muestran las búsquedas que ha devuelto tu sitio web.
  • Páginas

    La URL final enlazada por un resultado de la Búsqueda*.
  • Países

  • Dispositivos

    Mobile, Desktop o Tablet
  • Tipo de búsqueda

    Tipo de búsqueda de Google realizada por usuarios: búsqueda web (opción predeterminada), búsqueda de imágenes, búsqueda de vídeos, etc
  • Aparición en búsquedas

    Representa una función especial de resultados de búsqueda, como un tipo de resultado enriquecido o una página AMP, sus posibles valores son:
    • Resultados de AMP no enriquecidos:
      resultados de búsqueda básicos y sin imágenes que dirigen a páginas AMP.

    • Resultados enriquecidos de artículos de AMP:herramientas de
      enlaces de resultados de búsqueda con elementos visuales, como imágenes de páginas AMP, y un resumen del contenido. Estos resultados pueden mostrarse en bloques independientes dentro de la página de resultados, o bien pueden incluirse en carruseles de resultados similares. Este tipo de resultados se consideran resultados enriquecidos.

    • Historias AMP:
      Un formato de narrativa visual basado en AMP que permite que los usuarios interactúen con imágenes y vídeos a pantalla completa.

    • Aplicación Android:
      Resultado de búsqueda móvil del enlace de instalación de una aplicación Android o de su página. Sigue las directrices de indexación de la aplicación Android Firebase para indexar una aplicación Android y hacer que aparezca en los resultados de búsqueda.

    • Evento:
      Resultados enriquecidos de eventos. Más información sobre cómo se miden los clics y las impresiones en eventos

    • Preguntas frecuentes:
      una página de preguntas frecuentes.

    • Google Play Instant:
      Aplicaciones móviles diseñadas para ejecutarse en modo de prueba en dispositivos móviles directamente desde los resultados de búsqueda, sin tener que descargarlas de antemano.

    • How-to:
      Resultados enriquecidos de instrucciones.


      Detalles de empleos:
      Resultados de ofertas laborales que muestran descripciones detalladas de puestos de trabajo. Más información sobre cómo se miden los clics y las impresiones en ofertas de empleo.

    • Ofertas de empleo:
      Resultados de ofertas laborales que muestran datos generales de puestos de trabajo. Más información sobre cómo se miden los clics y las impresiones en ofertas de empleo.

    • Acciones multimedia:
      Acciones para reproducir datos estructurados de música, series y películas como, por ejemplo, escuchar o mirar.

    • Resultados enriquecidos de preguntas:
      Resultados enriquecidos de páginas de preguntas y respuestas.

    • Resultados enriquecidos:
      Cualquier tipo de resultado enriquecido marcado con datos estructurados que aparecen en la galería de búsqueda. Aquí se encuadran todos los subtipos de resultados enriquecidos, incluidos los de ofertas de empleo y los de artículos de AMP.

    • Enlace a los resultados de búsqueda:
      Enlaces que se muestran en los resultados de búsqueda.

    • Resultados de Web Light:
      Versiones ligeras y transcodificadas de páginas web, optimizadas para verse con conexiones de datos lentas.

Informe de Rendimiento vía Web

Los datos que muestra la herramienta de Search Console son de una utilidad brutal, pero algo que he aprendido es que debes conocer muy bien cómo se agregan y suman determinados datos. A grandes rasgos esto es lo que vemos.

Search Console via web


Google Search Console nos ofrece una gráfica con la evolución de las métricas que queramos ver y filtrado por las dimensiones que hayamos seleccionado, pero esta interface web tiene varias desventajas, alguna muy importante!

Limitaciones del interface web

Existen una serie de limitaciones en cómo podemos filtrar las dimensiones:

  • Filtros muy básicos para "landing" y para "Consulta"
    Google Search Console solamente nos deja filtrar las keywords y las urls de destino con las siguientes combinaciones.

    • Que contenga
    • Que no contenga
    • Es exactamente 
Esto en la mayoría de proyectos se nos va a quedar muy corto, por ejemplo si quieres eliminar las búsquedas de marca no puedes crear más de una condición para decir por ejemplo, si nuestro site fuese El Corte Inglés no podríamos eliminar la marca fácilmente porque no podrías crear dos filtros, uno "que contenga 'vestidos'" y a la vez otro filtro "que no contenga 'corte ingles'", cosa que sí podemos hacer en Google Analytics por ejemplo.

Tampoco permite expresiones regulares que nos cumpliría esa función y otras muchas ventajas.

Lo mismo ocurre con las urls, y no puedes crear grupos de URLs, por ejemplo las urls de una sección, para poder así ver los datos de cada sección de tu site de una forma segmentada.

Las carencias que conlleva estas limitaciones a la hora de crear los filtros son para mi una gran limitación a la hora de explotar correctamente esos datos.

  • Solo puedes ver y descargar 1000 resultados.
    Puede que haya proyectos que con esa cantidad sea suficiente, pero para cualquier negocio mediano te quedarás con la miel en los labios... Si a tu site llegan los usuarios por 1000 keywords´únicas te podrás descargar casi todas, pero normalmente será bastante más, por lo que solo verás las TOP 1000. Como veremos más adelante, esto es una muestra muy pequeña en comparación con otros métodos de obtener los datos y una muestra mucho más pequeña que la realidad.
  • Si aplicas algunos filtros combinados obtendrás datos incoherentes.
    Vamos a ver un ejemplo, podéis repetirlo vosotros mismos para ver que seguramente os ocurra lo mismo.. En este ejemplo filtramos por:

    • Tipo de búsqueda: web
    • Fecha: rango de fechas
    • Consulta: no contiene kw de marca


      Incoherencia de datos Search Console



      Podemos ver que para esta combinación de dimensiones hay 143.000 clicks, ok, ¿por qué no?... Ahora vamos a aplicar otro filtro, esta vez de país para que nos muestre los datos solo de los usuarios de España.

      Aplicar filtro de pais en search console



      Vemos cómo al aplicar el filtro de país, los clicks han pasado de 143.000 a 233.000, un aumento de casi el 63%. Pero como os daréis cuenta en cuanto os paréis a pensar aquí algo ocurre, ya que si no aplicamos el filtro de país tenemos menos clicks que si lo aplicamos, pero eso es imposible, como mucho, aplicando el filtro de país deberías tener los mismos, pero nunca más.

      Y podemos seguir aumentando el número de clicks si aplicamos otro filtro más, esta vez de url, y vamos a poner que la ur contenga el nombre de dominio.

      Search Console fitro pais url


      Ahora vamos a aplicar otro filtro por url que contenga el nombre del dominio vuelven a aumentar los clicks!!!.

      No sé a vosotros, pero esto a mi me genera muchísima desconfianza, ¿qué dato es el correcto? ¿por qué ocurre esto? no esperéis que en este artículo lo desvelemos, pero intuyo que es debido al muestreo de datos que Search Console realiza dependiendo según qué dimensiones le pidas, algo parecido ocurre en Google Analytics

Consolidación de datos

Para complicarlo todo un poquito más Google realizó un cambio el 10 de abril en la manera en que agrega los datos a cada URL y anunció la consolidación de urls canónicas, o lo que es lo mismo, los datos de las urls no-canónicas se agregarán a las urls canónicas, no a las que hayas definido tú con el meta canonical, sino a las urls canónicas que Google ha seleccionado.

Normalmente en la mayoría de urls que contienen un meta canonical hacia otra url porque nosotros lo hemos decidido suele coincidir con la seleccionada por Google, pero hay casos, a veces muchos, que no es así y que Google selecciona otra url como canónica a la que ha seleccionado el usuario, esto lo podemos ver fácilmente en el informe de cobertura de Search Console.

Google a seleccionada otra url canonica a la del usuario herramientas de


Esto influye en algunos escenarios mucho más que en otros, por ejemplo, como explico y muestro en el artículo que escribí sobre esta consolidación de datos, las páginas webs que tienen versiones separadas para Mobile y para Desktop son uno de los casos en los que más repercusión tiene esto, ya que todas las urls de la versión Mobile, bajo m.dominio.com llevan un meta canonical hacia su url equivalente de versión Desktop, es decir, en Search Console TODOS los datos que antes se asociaban a las urls de la versión Mobile se añadirán a su url equivalente en la versión Desktop.

Aunque en el Informe de Rendimiento de Google Search Console podemos filtrar por la dimensión "dispositivo" los datos no coinciden con los anteriores a la consolidación, lo que para algunos paranoicos de los datos nos supone añadir más incertidumbre / desconfianza.


Pero no solo queda en la versión Mobile, sino que cualquier url que Google selecciona como canónica de otra se agregarán datos, incluso si es otro dominio.... El problema radica en que ahora no sabemos a cuántas urls REALES hacen referencia nuestras métricas, y para no morir en el intento, es mejor llegado a este punto, mirar para otro lado, siendo siempre conscientes de lo que ocurre.



Continuará.....

 


Norek Beat (@norek_beat)hace Hace más de 4 años y 248 días

Realmente.. de verdad buen articulo, gracias. Aparte de la historia del principio,he comprendido por fin la posición media. No es ni la primera vez ke lo leo ni sera la ultima.

India (@)hace Hace más de 4 años y 208 días

Buen día, muy buenas explicaciones! Justo estoy viendo las métricas de una consulta exacta. Cuando miro las páginas y sumo el total de clics coincide con lo indicado pero al sumar el total de impresiones, de urls, no coincide con el total que se indica para esa consulta.
También, al mirar impresiones por día coincide con el total de impresiones para esa keyword. Sólo para páginas, al sumarlas me dá muchísima diferencia. Sabes porque sucede eso o cual es el cálculo que tengo que hacer?
Muchas gracias!

Lino (@errioxa)hace Hace más de 4 años y 207 días

@India eso es debido a que si no solicitas la dimensión de página siempre hace los cálculos por propiedad, que solo tiene en cuenta el primero de los resultados de tu site para una consulta,aunque haya más.

En cambio, si se solicita la dimensión de página lo hará por página, y sumará los datos para todas las urls que aparecieron en los resultados y no solamente el primer resultado, como consecuencia tiene más datos de impresiones, porque cuenta todas y no solo la mejor posicionada.

Puedes comprobarlo si aplicas un filtro de página indicando que contenga el nombre de tu site, por ejemplo "tudominio.dev".

Saludos!

Mario (@)hace Hace más de 3 años y 67 días

Estoy tratando de vincular los datos en Google Data Studio y he combinado los datos de la tabla "Impresión del sitio" con "Impresión de URL" y obtengo arroja menos clics que cuando solo uso la tabla "Impresión de URL". ¿Esto a qué se debe? Lo que intento es obtener la posición media de una URL. Muchas gracias por el artículo me había dado cuenta de muchas incoherencias en Search Console, pero bueno. No es que Google tenga tampoco mucha documentación a detalle, entonces mucho no se puede esclarecer. En fin, es lo que hay.



Lea otros artículos de Google Search Console

Últimos posts

Últimos comentarios


Resham Singh Mahal

Post: Experimento para comprobar la teoría del primer enlace

Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt