Google ignora cualquier meta tras un elemento inválido en el head

Publicado el 26 de mayo del 2022 (Lino Uruñuela)

 

La documentación de Google se actualiza continuamente, se añaden nuevas especificaciones, se eliminan otras y de vez en cuando amplia la información sobre algún tema del cual no teníamos información previa.

En este último caso podemos clasificar una de las actualizaciones que se realizó el 10 de Mayo del 2022, concretamente la actualización en la documentación de Google dice "Se ha añadido documentación sobre cómo usar metadatos de página válidos.".

 

Meta Head SEO

 

Esta ampliación de la información en su documentación nos recomienda "encarecidamente" no utilizar elementos inválidos dentro del <head> de la página, ya que los elementos posteriores a un elemento inválido en el <head> serán ignorados.

Y esto puede ser muy importante, y quizás, de explicaciones a lo que previamente podríamos creer que es un comportamiento extraño de Google a la hora de valorar determinadas etiquetas como el meta canonical o el meta robots noindex.

 

Según esta documentación los elementos válidos dentro del <head> son los siguientes:

  • title
  • meta
  • link
  • script
  • style
  • base
  • noscript
  • template

 

Y ninguno más! es decir, todo lo que añadamos en nuestro head que no corresponda a uno de estos elementos provocará que Google ignore cualquier otro elemento válido que haya tras el elemento inválido. Pongamos un ejemplo para verlo más claro, imaginemos que tenemos el siguiente código en nuestro <head>

 

<head>
	<title>Título</title>
	<link rel="icon" href="https://www.mecagoenlos.com/faviconn.png">
	<meta name="DESCRIPTION" content="Descripcion... ">	
	<meta name="robots" content="noindex" />
</head>

 

Con este código en nuestra URL, Google no indexaría el contenido ya que tienen un meta robots con valor noindex, que como hemos visto muchas veces impide a los buscadores mostrar esta URL en sus resultados, y por lo tanto la URL no será indexable.

En cambio, y según la última actualización de la documentación de Google, el siguiente código no impide que los buscadores indexen y muestren el contenido de esta URL en sus resultados ya que, en el código fuente, existe un elemento inválido para el <head>

 

<head>
	<title>Título</title>
	<link rel="icon" href="https://www.mecagoenlos.com/faviconn.png">
	<meta name="DESCRIPTION" content="Descripcion... ">
	<iframe src="javascript:void(0)" ></iframe>	
	<meta name="robots" content="noindex" />
</head>

 

Concretamente el elemento inválido es <iframe src="javascript:void(0)" ></iframe> por lo que cualquier código en el <head> tras esta línea será ignorado por Google, en este ejemplo el meta robots noindex sería ignorado por lo que la URL podría ser indexada.

Así que vamos a probarlo, y lo vamos a hacer en este mismo post. Si miráis el código fuente veréis el elemento inválido en el <head> y tras él, el meta robots con valor noindex.

Si la documentación de Google es correcta, este contenido se indexará en Google ya que ignorará el meta robots. El experimento está en marcha!

 

 

 




Lea otros artículos de Links y experimentos

Últimos posts

Últimos comentarios


Resham Singh Mahal

Post: Experimento para comprobar la teoría del primer enlace

Joakim Hov Johnsen

Post: Experimento para comprobar la teoría del primer enlace

Dana

Post: Experimento para comprobar la teoría del primer enlace

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos

Señor Muñoz
Lino, el 11% más de clicks y el 47% más de impresiones diarias ¿es algo constante o depende de cada sitio web?
Post: Diferencias entre la exportación de datos de Search Console usando BigQuery o usando la API

Carlos
Hola En mi blog tengo artículos atemporales (es decir, no caducan nunca, de manera que sirve para quien lo lea hoy o lo lea dentro de 5
Post: Tratamiento de urls que tienen un tiempo de vida muy corto

Profe Ray
Veo que hay comentarios de hace 5 años y de hace 3 años. ¿Habrá algun post actualizado sobre este tema o sigue funcionando? Lo cierto es
Post: Cómo cargar css y js y no bloquear la carga de contenido

Pepe
Muchas gracias por el articulo!! Muy buena información.
Post: Qué es ofuscar enlaces y cómo mejora el enlazado interno

María
Sí, he buscado el archivo robots.txt y todo está correcto. La última versión vista con error fue el 08/11/2021 y la última vez que el
Post: Errores críticos originados por el robots.txt

Lino
@María un placer verte por aquí :) Lo primero, a veces, con el robots.txt no se puede "forzar" a que lo rastree, si tu site no es muy p
Post: Errores críticos originados por el robots.txt