Google ignora cualquier meta tras un elemento inválido en el head

Publicado el 26 de mayo del 2022 (Lino Uruñuela)

 

La documentación de Google se actualiza continuamente, se añaden nuevas especificaciones, se eliminan otras y de vez en cuando amplia la información sobre algún tema del cual no teníamos información previa.

En este último caso podemos clasificar una de las actualizaciones que se realizó el 10 de Mayo del 2022, concretamente la actualización en la documentación de Google dice "Se ha añadido documentación sobre cómo usar metadatos de página válidos.".

 

Meta Head SEO

 

Esta ampliación de la información en su documentación nos recomienda "encarecidamente" no utilizar elementos inválidos dentro del <head> de la página, ya que los elementos posteriores a un elemento inválido en el <head> serán ignorados.

Y esto puede ser muy importante, y quizás, de explicaciones a lo que previamente podríamos creer que es un comportamiento extraño de Google a la hora de valorar determinadas etiquetas como el meta canonical o el meta robots noindex.

 

Según esta documentación los elementos válidos dentro del <head> son los siguientes:

  • title
  • meta
  • link
  • script
  • style
  • base
  • noscript
  • template

 

Y ninguno más! es decir, todo lo que añadamos en nuestro head que no corresponda a uno de estos elementos provocará que Google ignore cualquier otro elemento válido que haya tras el elemento inválido. Pongamos un ejemplo para verlo más claro, imaginemos que tenemos el siguiente código en nuestro <head>

 

<head>
	<title>Título</title>
	<link rel="icon" href="https://www.mecagoenlos.com/faviconn.png">
	<meta name="DESCRIPTION" content="Descripcion... ">	
	<meta name="robots" content="noindex" />
</head>

 

Con este código en nuestra URL, Google no indexaría el contenido ya que tienen un meta robots con valor noindex, que como hemos visto muchas veces impide a los buscadores mostrar esta URL en sus resultados, y por lo tanto la URL no será indexable.

En cambio, y según la última actualización de la documentación de Google, el siguiente código no impide que los buscadores indexen y muestren el contenido de esta URL en sus resultados ya que, en el código fuente, existe un elemento inválido para el <head>

 

<head>
	<title>Título</title>
	<link rel="icon" href="https://www.mecagoenlos.com/faviconn.png">
	<meta name="DESCRIPTION" content="Descripcion... ">
	<iframe src="javascript:void(0)" ></iframe>	
	<meta name="robots" content="noindex" />
</head>

 

Concretamente el elemento inválido es <iframe src="javascript:void(0)" ></iframe> por lo que cualquier código en el <head> tras esta línea será ignorado por Google, en este ejemplo el meta robots noindex sería ignorado por lo que la URL podría ser indexada.

Así que vamos a probarlo, y lo vamos a hacer en este mismo post. Si miráis el código fuente veréis el elemento inválido en el <head> y tras él, el meta robots con valor noindex.

Si la documentación de Google es correcta, este contenido se indexará en Google ya que ignorará el meta robots. El experimento está en marcha!

 

 

 




Lea otros artículos de Links y experimentos

Últimos posts

Últimos comentarios


Lino
@spamloco a tí r hacerme ver que no soy al único que le importa :p A ver si nos vemos!
Post: ¿Cómo decide Google que URL debe rastrear?

Alejandro
Gracias Lino, siempre investigando un poco más allá.
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
3,2,1... Gracias a ti Pedro!! y sí, parece que los humanos somos expertos en haciendo ruido cuando intentamos que alguien nos escuche... :p
Post: ¿Cómo decide Google que URL debe rastrear?

Pedro
1,2...1,2... probando. Gracias por el artículo, verdaderamente interesante ver cómo no paramos de generar ruido :)
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Funcionan!! Ahora solo tengo que generar engagement :D A ver si quito lo de avisar por Twitter... no sé cuántos años llevará sin funcio
Post: ¿Cómo decide Google que URL debe rastrear?

Juanan Carapapa
Yo también vengo a probar los comentarios, probando probando xD
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola @errioxa que tal
Post: ¿Cómo decide Google que URL debe rastrear?

Lino2
Hola
Post: ¿Cómo decide Google que URL debe rastrear?

Lino
Probando!
Post: ¿Cómo decide Google que URL debe rastrear?

JaviLazaro
Ya me has dado la necesidad de crear un comaando en bash para hacer estas cosas. Gracias Lino por estos tips
Post: Obtener KWs de varias fuentes usando la línea de comandos