John Mueller a indiqué dans un hangout pour webmaster du 1er juillet 2016 que la lecture de l'attribut "hreflang" propre aux sites multilingues peut ne pas être lu par les robots de Google en cas de section <head> erronée en HTML. Il serait dommage d'empêcher Google de crawler correctement les pages dans toutes les langues d'un site uniquement à cause d'une ou plusieurs erreurs HTML (faciles à corriger en général).
Voici les propos tenus par le porte-parole de Google
Il peut arriver que nous ne reconnaissions pas du tout le balisage hreflang dans les pages. Par exemple, ce qui pourrait arriver est que nous analysions et indexions les pages, mais quand nous les affichons, quelque chose dans la section d'entête des pages est ajouté au début, et ce type de chose "casse" le head qui contient l'attribut hreflang.
En théorie cela pourrait se produire. Et si nous ne pouvons pas trouver du tout le balisage hreflang, nous ne considérerons pas cela comme une erreur, parce que nous penserons qu'il n'y a rien de mal à avoir une page sans hreflang. Donc il pourrait être intéressant d'effectuer un double contrôle. Il suffit d'ouvrir la page dans un navigateur et d'utiliser Inspect Element (dans les outils de développement, NDLR) pour voir ce à quoi ressemble réellement la page. Et puis il faudrait s'assurer de vérifier la section d'entête, il n'y a rien de tel qu'un type de meta non répertorié pour provoquer cela.
En d'autres termes, John Mueller indique qu'une erreur HTML présente dans la section <head> du code, placée avant le balisage hreflang, peut provoquer des problèmes de lecture par le moteur. Cela signifie aussi que des problèmes de code peut entraîner le robot à "sauter" des portions de code dans certains cas d'erreur. Attention donc à ne pas se tromper de valeur d'attribut, de syntaxe, etc. ;-)