Nombre d'entre nous savent que l'historique des pages web peut influencer quelque peu leur classement dans les résultats des moteurs de recherche. Même si certains référenceurs ont toujours hésité à ce sujet, il semblerait qu'un critère de ce type soit bel et bien en place depuis un moment sur Google.
Parmi les recherches que j'effectue sans cesse, je me suis retrouvé nez-à-nez avec un brevet intitulé Document scoring based on document inception date publié officiellement le 27 août 2013 (mais dont l'origine remonte à 2010) dans lequel Matt Cutts est intervenu.
Quel est l'intérêt de l'historique des pages web ?
Google cherche par tous les moyens a valoriser les pages web, ce n'est plus un secret, et l'historique des pages peut ajouter une surcouche de notation pour évaluer encore davantage les documents web.
En effet, Google mène sa quête de qualité en essayant toujours plus d'ajouter des facteurs de notation pour améliorer le ranking final. Les spécialistes parlent souvent de l'ancienneté d'un document et des liens comme un critère de positionnement, ce brevet en est la preuve en partie puisque tout est expliqué à l'intérêt, même la formule de calcul de la note influencée par l'historique des pages web.
Comment Google évalue et note les pages web en fonction de leur historique ?
Tout d'abord, il faut savoir que Google détermine la date de création d'un document à partir du moment où il le découvre, et non à partir du moment où il est réellement créé et déposé sur un serveur. En d'autres termes, un document ancien de 2 ans qui aurait été non crawlé perd ses deux ans d'ancienneté, cela justifie encore davantage l'intérêt d'une indexation réussie. Plus nous perdons de temps pour indexer nos pages, plus nous réduisons l'ancienneté des pages web... Il s'appuie sur les liens qui mentionnent les pages web, sur les Sitemaps XML ou autres techniques pour en prendre connaissance.
Une fois la date déterminée, le deuxième facteur est en toute logique la durée de vie du document, ou tout du moins sa longévité, mais nous verrons par la suite que ce n'est pas seulement cela qui détermine la note finale fondée sur l'historique des pages web.
Création d'un document
Pour les documents nouvellement créés, Google analyse l'ancienneté du document en fonction de sa date de création mais inclue parallèlement une analyse du profil des liens entrants. En effet, le brevet précise qu'un document plus ancien sera souvent mieux valorisé qu'une page web récente car le nombre de backlinks obtenus sera sûrement plus élevé et favorisera son classement.
En réalité, Google étudie le taux de croissance du profil de liens en fonction de l'historique des pages pour dresser une "moyenne d'évolution". C'est cette moyenne obtenue qui explique en partie pourquoi des pages plus anciennes restent très valorisée et que certaines pages très récentes sont aussi bien classée. De ce fait, si une page obtient des backlinks en nombre et trop rapidement, la page améliorera son taux de croissance et sera réévaluée et mieux positionnée, même si la page est plus récente qu'une autre avec un même nombre de backlinks (en effet, son taux de croissance serait plus faible dans ce cas que la page récente, donc elle serait placée en retrait).
En revanche, si une page obtient beaucoup trop de backlinks d'un coup, elle sera considérée comme du spam et verra sa note d'historique sous-évaluée (sans parler de pénalité bien entendu...) fortement ainsi que son classement...
Enfin, il faut savoir que Google ne favorise pas forcément les documents anciens ou les documents récents. En réalité, lorsqu'une requête est tapée, le moteur calcule l'âge moyen des pages web qui vont être affichées dans les SERP. C'est cet âge moyen qui sert de référence pour positionner plus ou moins bien des pages web en fonction de leur ancienneté (cela n'étant qu'un critère parmi tant d'autres bien entendu).
Le brevet précise la formule mathématique qui permet de calculer la note de l'historique :
H = L / Log(F+2)
- "H" correspond à la note d'historique de la page web ;
- "L" correspond à la note du profil des liens obtenus par la page web (PageRank, etc.) ;
- "F" correspond au temps écoulé depuis la date de création de la page web (ou sur une période donnée dans certains cas) ;
- le "+2" et le calcul logarithmique sont là pour compléter le calcul et obtenir la note finale.
Nous nous rendons compte que la note de l'historique n'a en réalité pas vraiment de rapport direct avec l'ancienneté des documents mais plutôt avec la qualité du profil de liens fondée sur son taux de croissance (rapidité de développement du profil de liens en fonction de la durée de vie d'une page web).
Modification d'un document
L'ancienneté d'un document ne peut pas être notée uniquement à partir d'une date de création car la vie d'une page web est parfois mouvementée à cause des nombreuses mises à jour du document. Google a donc trouvé la parade pour maintenir son niveau de qualité en calculant une note de mise à jour du document.
La formule est la suivante : U = f (UF,UA)
- "U" est la note de mise à jour ;
- "f" est une fonction de calcul (une somme ou une somme pondérée selon le brevet) ;
- "UF" correspond à la fréquence de mise à jour (basé sur l'ancienneté du document) ;
- "UA" correspond à une note de mise à jour en fonction de plusieurs facteurs tels que le nombre de mises à jour, l'intervalle de temps entre ces mises à jour, la progression ou la régression des mises à jour en fonction du temps, etc.
Cette note de mise à jour permet de mieux évaluer la note finale apportée par l'historique, elle se calcule selon plusieurs critères :
- Si une page augmente son taux de mise à jour, sa note d'historique va être mieux évaluée ;
- Si une page obtient davantage de backlinks sur des périodes de temps plus courtes, sa note va être surévaluée ;
- Si une page a une fréquence de mise à jour importante, la note va être améliorée.
Rien de très original au final, mais cela influence la note d'historique.
Conclusion
Je n'ai pas pu détailler tout le brevet tant le nombre de facteurs et de précisions est important. En effet, il fait appel à de nombreuses connaissances et implique d'autres brevets dans ses calculs mais l'essentiel était de montrer deux choses, et j'espère avoir réussit cette mission :
- Prouver que l'historique et l'ancienneté des documents influence réellement le positionnement des pages.
- Démontrer que ce n'est pas seulement l'âge des pages qui favorise la note d'historique, mais bien les éléments qui composent la vie d'une page au fur et à mesure du temps (profil des liens, taux de modifications et de mises à jour, croissance forte ou régressive, etc.)