Google personnalise les titres sans balise title

Mathieu Chartier Référencement 7 commentaires

Les mois défilent et Google ne cesse d'affiner ses critères de positionnement et de rendu visuel. Déjà existant depuis des mois, Google personnalise parfois (rarement ?) les descriptions des sites dans ses résultats de recherche ainsi que ces titres afin de répondre plus favorablement aux requêtes des internautes.

Ce phénomène de niche tend a fortement se généraliser en se basant, semble-t-il, sur des notions sémantiques. Plusieurs cas m'ont récemment surpris, je vais donc en utiliser un en guise d'exemple pour appuyer cet aspect. Comme nous le disions précédemment, Google arrive à personnaliser ces pages de résultats en tirant profit du code source, et donc en mettant lui-même en avant certains contenus. Pour cela, le moteur utilise une sorte de hiérarchie de critères. Par défaut, la balise <title> est prise en compte pour le titre ainsi que la balise meta "description" pour le snippet (court extrait de présentation du site web). En revanche, quand un site est peu - ou pas du tout - optimisé, Google se retrouve face à un dilemme de poids. Depuis plusieurs années, le problème du snippet semble régler, le moteur optant pour des extraits des contenus en remplacement d'une balise meta "description" vide. En revanche, pour le titre, cela est plus problématique...

Nombre de <title> sont laissés vides par méconnaissance de ce critère pourtant si important aux yeux des moteurs. Ceci provoque généralement un affichage des plus déplaisants et peu attirant pour les internautes, on retrouve ainsi les classiques "untitled", "sans titre", "document sans titre" (lorsque votre logiciel entre ça par défaut) ou pire, un simple point "." comme c'était le cas dans l'exemple qui va suivre. J'entends déjà mes oreilles siffler à cause de référenceurs disant que je n'apporte rien en rappelant ceci. En effet, Google a trouvé la parade depuis quelques mois en affichant de temps en temps la balise <h1> (titre de niveau 1), mais ce cas est rare et dispersé dans la masse de sites non optimisés.

Venant en donc à mon exemple, plus marquant, et corroboré par d'autres cas que vous rencontrerez certainement dans les semaines et mois à venir. La question est simple, qu'est-ce que Google peut afficher lorsqu'il n'y a ni <title>, ni <h1> ? Allons même plus loin, affichera-t-il un titre "personnalisé" si en plus des deux balises précédentes, des meta sont manquantes ainsi que certaines expressions clés correspondant à la thématique de la page ? Je n'aurais pas la prétention de dire que j'ai trouvé réponse à ces questions, mais fort est de constater que Google réussit un pari en affichant des titres dans ses résultats de recherche sans avoir aucune des données nécessaires à cet effet...

L'exemple du site web de la ligue de Taekwondo Limousin Poitou-Charentes est probant. Le site comporte un <title> vide et ne détient ni de balises meta "title" (inutiles en théorie, mais pourtant utilisée lorsque la balise du même nom est manquante), ni de <h1> dans le corps de page (<body>). Le titre affiché par Google il y a un mois était un simple point "." à peine visible dans les SERP mais depuis peu, le moteur affiche "Ligue Limousin Poitou Charentes" (voir illustration ci-dessous) sans trop savoir d'où cela provient. Les médisants diront là encore que tout est normal, mais il faut prendre en compte une donnée essentielle liée à la thématique de l'exemple... Le taekwondo était composé jusqu'à maintenant de comités, remplacés depuis quelques mois par le statut de "ligue". Le site susnommé a été réalisé par des néophytes sous Joomla et ils n'ont pas mis à jour les meta "description" et "keywords" comme l'illustration le prouve, la page d'accueil est donc encore fondée sur l'ancien modèle des comités, le mot "ligue" n'apparaissant dans aucun des critères "in-page" reconnus par les référenceurs. Alors, que se passe-t-il ?

Le titre affiché par Google, pour rappel, est "Ligue Limousin Poitou Charentes", il doit donc provenir de quelque part, non ? Après analyse du code source, l'expression exacte n'apparaît qu'une seule fois au fin fond d'un article (et pas le premier des articles), nous pouvons donc douter du fait que Google vienne pêcher au milieu des contenus en déduisant "tiens, ça doit être bon pour un titre ça...". Soyons honnêtes, il semble net et précis que des aspects thématiques et sémantiques entrent en compte dans ce choix pourtant non évident au regard du code source. J'ai tenté d'aller plus loin en me basant sur un critère cher aux référenceurs : la densité de mots-clés. Effectivement, l'expression "limousin poitou charentes" est 3e de la liste, mais le mot "ligue" est 44e derrière "comité" en 13e position. En outre, pourquoi le mot "taekwondo" n'a-t-il pas été pris en compte par Google ? Il répond amplement à la thématique du site mais n'est pas cité... Je précise qu'aucun rapport avec une personnalisation de l'historique ou GooglePlus n'est évidente dans ce cas, l'exemple a été testé sur des navigateurs "neufs" sans connexion à un compte Google et avec un historique et un cache vidés. J'avoue que plusieurs exemples du même type se sont récemment présentés et certaines interrogations demeurent. Certes, j'admets que Google personnalise ou tire profit d'autres critères pour choisir son titre, tout comme sa description, mais cet exemple est parfait pour prouver le moteur n'utilise pas forcément les critères que nous défendons tous pour afficher ce titre, et je le répète, ce phénomène est récent et plus abouti que les titres personnalisés des mois passés...

Titre affiché par Google sans title

L'objectif de cet article était de soulever la question : sur quels critères se base Google pour personnaliser ces nouveaux titres ? Je suis preneur d'idées ou d'hypothèses concernant cette nouvelle mouture. Les autres moteurs ne procèdent pas à ces choix, Bing n'affichant que le premier <h3> rencontré à titre d'exemple. Nul doute que les titres non optimisés risquent de disparaître peu-à-peu au profit de personnalisations du moteur, il faudra donc être vigilant à l'avenir pour repérer les sites réellement optimisés...

7 commentaires

  • GG propose un titre alternatif lorsque la balise title est absente ou non remplie (comme décrit dans votre billet) ou lorsqu'elle est non représentative ou trop longue ou répétée sur plusieurs pages ou bourrée de mots clefs... GG explique cela dans une vidéo => cf. mon billet sur le sujet (lien dans le nom du commentaire)

    • Merci pour votre article. En effet, je connaissais ces pratiques, mais justement, ce que je soulève là est qu'il n'y a quasiment aucun rapport entre le titre affiché et le code source de la page en question. L'expression "Ligue Limousin Poitou Charentes" n'est utilisée que dans un article (parmi dix articles), n'est dans aucune balise importante. Seules les ancres de lien que j'ai fait à partir de deux sites sont "Ligue Poitou Charentes de Taekwondo", on est donc pas sur la même longueur d'onde avec Google.
      Je cherche donc à comprendre pourquoi et comment Google peut-il déduire qu'il faut employer le mot "ligue" plutôt que "comité" (qui a une densité plus forte) et qu'il oublie le mot "taekwondo" pourtant relatif au sujet et écrit partout...

  • Chiite dit :

    Bonne question en effet mais quand on fait une commande de ce style : "site:www.crtlpc.fr ligue" il y a quand même pas mal de pages.

    Peut être google regarde le texte des ancres qui pointent vers cette page.

    • Je suis le seul à faire des ancres de lien vers ce site depuis le changement de nom, avec la fédération de taekwondo, mais je ne mets pas seulement "Ligue Limousin Poitou Charentes", le mot "taekwondo" est trop important pour être omis dans l'ancre du lien... :S

  • lionel dit :

    Bonjour Mathieu,

    Le test est très intéressant et suscite une réflexion sur le sujet. En même temps, il serait pertinent de multiplier les cas dans le sens où ce qui fonctionne pour un site ne fonctionnera pas forcément pour un autre.

    amicalement

    • Bonjour,
      En effet, je n'ai pas la prétention ni la certitude que cette situation se retrouve dans chaque cas, mais cela prouve au moins que des cas "inexpliqués" existent, et j'avoue que je cherche encore à savoir comment Google peut faire ce choix comme par enchantement... Je n'abandonne pas et si je trouve d'autres cas aussi pertinents à étudier, je vous les fournirais sur le blog, sans hésiter. :D
      Cordialement.

  • Zarc dit :

    Bonjour

    Une idée en l'air : les ancres qui contiennent le mot "ligue" sont en fait du traffic.
    Google voit le "traffic" et peut être que c'est à travers ce traffic d'un point à un autre qu'il valide le choix du mot ligue.
    Un peu comme tomtom gps qui voit les embouteillages directement avec les gps embarqués. Ce qui lui permet de proposer des trajets alternatifs.Tomtom ne tient pas à jour une base de route, il voit les nouvelles car les points gps de sa flotte les font apparaitre, il valide ensuite sur carte.

  • Déposer un commentaire

    L'adresse de messagerie ne sera pas publiée.* Champs obligatoires