Les mois défilent et Google ne cesse d'affiner ses critères de positionnement et de rendu visuel. Déjà existant depuis des mois, Google personnalise parfois (rarement ?) les descriptions des sites dans ses résultats de recherche ainsi que ces titres afin de répondre plus favorablement aux requêtes des internautes.
Ce phénomène de niche tend a fortement se généraliser en se basant, semble-t-il, sur des notions sémantiques. Plusieurs cas m'ont récemment surpris, je vais donc en utiliser un en guise d'exemple pour appuyer cet aspect. Comme nous le disions précédemment, Google arrive à personnaliser ces pages de résultats en tirant profit du code source, et donc en mettant lui-même en avant certains contenus. Pour cela, le moteur utilise une sorte de hiérarchie de critères. Par défaut, la balise <title> est prise en compte pour le titre ainsi que la balise meta "description" pour le snippet (court extrait de présentation du site web). En revanche, quand un site est peu - ou pas du tout - optimisé, Google se retrouve face à un dilemme de poids. Depuis plusieurs années, le problème du snippet semble régler, le moteur optant pour des extraits des contenus en remplacement d'une balise meta "description" vide. En revanche, pour le titre, cela est plus problématique...
Nombre de <title> sont laissés vides par méconnaissance de ce critère pourtant si important aux yeux des moteurs. Ceci provoque généralement un affichage des plus déplaisants et peu attirant pour les internautes, on retrouve ainsi les classiques "untitled", "sans titre", "document sans titre" (lorsque votre logiciel entre ça par défaut) ou pire, un simple point "." comme c'était le cas dans l'exemple qui va suivre. J'entends déjà mes oreilles siffler à cause de référenceurs disant que je n'apporte rien en rappelant ceci. En effet, Google a trouvé la parade depuis quelques mois en affichant de temps en temps la balise <h1> (titre de niveau 1), mais ce cas est rare et dispersé dans la masse de sites non optimisés.
Venant en donc à mon exemple, plus marquant, et corroboré par d'autres cas que vous rencontrerez certainement dans les semaines et mois à venir. La question est simple, qu'est-ce que Google peut afficher lorsqu'il n'y a ni <title>, ni <h1> ? Allons même plus loin, affichera-t-il un titre "personnalisé" si en plus des deux balises précédentes, des meta sont manquantes ainsi que certaines expressions clés correspondant à la thématique de la page ? Je n'aurais pas la prétention de dire que j'ai trouvé réponse à ces questions, mais fort est de constater que Google réussit un pari en affichant des titres dans ses résultats de recherche sans avoir aucune des données nécessaires à cet effet...
L'exemple du site web de la ligue de Taekwondo Limousin Poitou-Charentes est probant. Le site comporte un <title> vide et ne détient ni de balises meta "title" (inutiles en théorie, mais pourtant utilisée lorsque la balise du même nom est manquante), ni de <h1> dans le corps de page (<body>). Le titre affiché par Google il y a un mois était un simple point "." à peine visible dans les SERP mais depuis peu, le moteur affiche "Ligue Limousin Poitou Charentes" (voir illustration ci-dessous) sans trop savoir d'où cela provient. Les médisants diront là encore que tout est normal, mais il faut prendre en compte une donnée essentielle liée à la thématique de l'exemple... Le taekwondo était composé jusqu'à maintenant de comités, remplacés depuis quelques mois par le statut de "ligue". Le site susnommé a été réalisé par des néophytes sous Joomla et ils n'ont pas mis à jour les meta "description" et "keywords" comme l'illustration le prouve, la page d'accueil est donc encore fondée sur l'ancien modèle des comités, le mot "ligue" n'apparaissant dans aucun des critères "in-page" reconnus par les référenceurs. Alors, que se passe-t-il ?
Le titre affiché par Google, pour rappel, est "Ligue Limousin Poitou Charentes", il doit donc provenir de quelque part, non ? Après analyse du code source, l'expression exacte n'apparaît qu'une seule fois au fin fond d'un article (et pas le premier des articles), nous pouvons donc douter du fait que Google vienne pêcher au milieu des contenus en déduisant "tiens, ça doit être bon pour un titre ça...". Soyons honnêtes, il semble net et précis que des aspects thématiques et sémantiques entrent en compte dans ce choix pourtant non évident au regard du code source. J'ai tenté d'aller plus loin en me basant sur un critère cher aux référenceurs : la densité de mots-clés. Effectivement, l'expression "limousin poitou charentes" est 3e de la liste, mais le mot "ligue" est 44e derrière "comité" en 13e position. En outre, pourquoi le mot "taekwondo" n'a-t-il pas été pris en compte par Google ? Il répond amplement à la thématique du site mais n'est pas cité... Je précise qu'aucun rapport avec une personnalisation de l'historique ou GooglePlus n'est évidente dans ce cas, l'exemple a été testé sur des navigateurs "neufs" sans connexion à un compte Google et avec un historique et un cache vidés. J'avoue que plusieurs exemples du même type se sont récemment présentés et certaines interrogations demeurent. Certes, j'admets que Google personnalise ou tire profit d'autres critères pour choisir son titre, tout comme sa description, mais cet exemple est parfait pour prouver le moteur n'utilise pas forcément les critères que nous défendons tous pour afficher ce titre, et je le répète, ce phénomène est récent et plus abouti que les titres personnalisés des mois passés...
L'objectif de cet article était de soulever la question : sur quels critères se base Google pour personnaliser ces nouveaux titres ? Je suis preneur d'idées ou d'hypothèses concernant cette nouvelle mouture. Les autres moteurs ne procèdent pas à ces choix, Bing n'affichant que le premier <h3> rencontré à titre d'exemple. Nul doute que les titres non optimisés risquent de disparaître peu-à-peu au profit de personnalisations du moteur, il faudra donc être vigilant à l'avenir pour repérer les sites réellement optimisés...