Publicado el 26 de mayo del 2022 (Lino Uruñuela)
La documentación de Google se actualiza continuamente, se añaden nuevas especificaciones, se eliminan otras y de vez en cuando amplia la información sobre algún tema del cual no teníamos información previa.
En este último caso podemos clasificar una de las actualizaciones que se realizó el 10 de Mayo del 2022, concretamente la actualización en la documentación de Google dice "Se ha añadido documentación sobre cómo usar metadatos de página válidos.".
Esta ampliación de la información en su documentación nos recomienda "encarecidamente" no utilizar elementos inválidos dentro del <head> de la página, ya que los elementos posteriores a un elemento inválido en el <head> serán ignorados.
Y esto puede ser muy importante, y quizás, de explicaciones a lo que previamente podríamos creer que es un comportamiento extraño de Google a la hora de valorar determinadas etiquetas como el meta canonical o el meta robots noindex.
Según esta documentación los elementos válidos dentro del <head> son los siguientes:
Y ninguno más! es decir, todo lo que añadamos en nuestro head que no corresponda a uno de estos elementos provocará que Google ignore cualquier otro elemento válido que haya tras el elemento inválido. Pongamos un ejemplo para verlo más claro, imaginemos que tenemos el siguiente código en nuestro <head>
<head>
<title>Título</title>
<link rel="icon" href="https://www.mecagoenlos.com/faviconn.png">
<meta name="DESCRIPTION" content="Descripcion... ">
<meta name="robots" content="noindex" />
</head>
Con este código en nuestra URL, Google no indexaría el contenido ya que tienen un meta robots con valor noindex, que como hemos visto muchas veces impide a los buscadores mostrar esta URL en sus resultados, y por lo tanto la URL no será indexable.
En cambio, y según la última actualización de la documentación de Google, el siguiente código no impide que los buscadores indexen y muestren el contenido de esta URL en sus resultados ya que, en el código fuente, existe un elemento inválido para el <head>
<head>
<title>Título</title>
<link rel="icon" href="https://www.mecagoenlos.com/faviconn.png">
<meta name="DESCRIPTION" content="Descripcion... ">
<iframe src="javascript:void(0)" ></iframe>
<meta name="robots" content="noindex" />
</head>
Concretamente el elemento inválido es <iframe src="javascript:void(0)" ></iframe>
por lo que cualquier código en el <head> tras esta línea será ignorado por Google, en este ejemplo el meta robots noindex sería ignorado por lo que la URL podría ser indexada.
Así que vamos a probarlo, y lo vamos a hacer en este mismo post. Si miráis el código fuente veréis el elemento inválido en el <head> y tras él, el meta robots con valor noindex.
Si la documentación de Google es correcta, este contenido se indexará en Google ya que ignorará el meta robots. El experimento está en marcha!