L’historique selon Google : critère décrypté et détaillé.

Mathieu Chartier Référencement 11 commentaires

Nombre d'entre nous savent que l'historique des pages web peut influencer quelque peu leur classement dans les résultats des moteurs de recherche. Même si certains référenceurs ont toujours hésité à ce sujet, il semblerait qu'un critère de ce type soit bel et bien en place depuis un moment sur Google.

Parmi les recherches que j'effectue sans cesse, je me suis retrouvé nez-à-nez avec un brevet intitulé Document scoring based on document inception date publié officiellement le 27 août 2013 (mais dont l'origine remonte à 2010) dans lequel Matt Cutts est intervenu.

Quel est l'intérêt de l'historique des pages web ?

Google cherche par tous les moyens a valoriser les pages web, ce n'est plus un secret, et l'historique des pages peut ajouter une surcouche de notation pour évaluer encore davantage les documents web.

En effet, Google mène sa quête de qualité en essayant toujours plus d'ajouter des facteurs de notation pour améliorer le ranking final. Les spécialistes parlent souvent de l'ancienneté d'un document et des liens comme un critère de positionnement, ce brevet en est la preuve en partie puisque tout est expliqué à l'intérêt, même la formule de calcul de la note influencée par l'historique des pages web.

Note de l'historique des pages sur Google

Comment Google évalue et note les pages web en fonction de leur historique ?

Tout d'abord, il faut savoir que Google détermine la date de création d'un document à partir du moment où il le découvre, et non à partir du moment où il est réellement créé et déposé sur un serveur. En d'autres termes, un document ancien de 2 ans qui aurait été non crawlé perd ses deux ans d'ancienneté, cela justifie encore davantage l'intérêt d'une indexation réussie. Plus nous perdons de temps pour indexer nos pages, plus nous réduisons l'ancienneté des pages web... Il s'appuie sur les liens qui mentionnent les pages web, sur les Sitemaps XML ou autres techniques pour en prendre connaissance.

Une fois la date déterminée, le deuxième facteur est en toute logique la durée de vie du document, ou tout du moins sa longévité, mais nous verrons par la suite que ce n'est pas seulement cela qui détermine la note finale fondée sur l'historique des pages web.

Classement des pages web sur Google selon l'historique et l'ancienneté des pages

Création d'un document

Pour les documents nouvellement créés, Google analyse l'ancienneté du document en fonction de sa date de création mais inclue parallèlement une analyse du profil des liens entrants. En effet, le brevet précise qu'un document plus ancien sera souvent mieux valorisé qu'une page web récente car le nombre de backlinks obtenus sera sûrement plus élevé et favorisera son classement.

En réalité, Google étudie le taux de croissance du profil de liens en fonction de l'historique des pages pour dresser une "moyenne d'évolution". C'est cette moyenne obtenue qui explique en partie pourquoi des pages plus anciennes restent très valorisée et que certaines pages très récentes sont aussi bien classée. De ce fait, si une page obtient des backlinks en nombre et trop rapidement, la page améliorera son taux de croissance et sera réévaluée et mieux positionnée, même si la page est plus récente qu'une autre avec un même nombre de backlinks (en effet, son taux de croissance serait plus faible dans ce cas que la page récente, donc elle serait placée en retrait).

En revanche, si une page obtient beaucoup trop de backlinks d'un coup, elle sera considérée comme du spam et verra sa note d'historique sous-évaluée (sans parler de pénalité bien entendu...) fortement ainsi que son classement...

Enfin, il faut savoir que Google ne favorise pas forcément les documents anciens ou les documents récents. En réalité, lorsqu'une requête est tapée, le moteur calcule l'âge moyen des pages web qui vont être affichées dans les SERP. C'est cet âge moyen qui sert de référence pour positionner plus ou moins bien des pages web en fonction de leur ancienneté (cela n'étant qu'un critère parmi tant d'autres bien entendu).

Le brevet précise la formule mathématique qui permet de calculer la note de l'historique :

H = L / Log(F+2)

  • "H" correspond à la note d'historique de la page web ;
  • "L" correspond à la note du profil des liens obtenus par la page web (PageRank, etc.) ;
  • "F" correspond au temps écoulé depuis la date de création de la page web (ou sur une période donnée dans certains cas) ;
  • le "+2" et le calcul logarithmique sont là pour compléter le calcul et obtenir la note finale.

Nous nous rendons compte que la note de l'historique n'a en réalité pas vraiment de rapport direct avec l'ancienneté des documents mais plutôt avec la qualité du profil de liens fondée sur son taux de croissance (rapidité de développement du profil de liens en fonction de la durée de vie d'une page web).

Modification d'un document

L'ancienneté d'un document ne peut pas être notée uniquement à partir d'une date de création car la vie d'une page web est parfois mouvementée à cause des nombreuses mises à jour du document. Google a donc trouvé la parade pour maintenir son niveau de qualité en calculant une note de mise à jour du document.

La formule est la suivante : U = f (UF,UA)

  • "U" est la note de mise à jour ;
  • "f" est une fonction de calcul (une somme ou une somme pondérée selon le brevet) ;
  • "UF" correspond à la fréquence de mise à jour (basé sur l'ancienneté du document) ;
  • "UA" correspond à une note de mise à jour en fonction de plusieurs facteurs tels que le nombre de mises à jour, l'intervalle de temps entre ces mises à jour, la progression ou la régression des mises à jour en fonction du temps, etc.

Cette note de mise à jour permet de mieux évaluer la note finale apportée par l'historique, elle se calcule selon plusieurs critères :

  • Si une page augmente son taux de mise à jour, sa note d'historique va être mieux évaluée ;
  • Si une page obtient davantage de backlinks sur des périodes de temps plus courtes, sa note va être surévaluée ;
  • Si une page a une fréquence de mise à jour importante, la note va être améliorée.

Rien de très original au final, mais cela influence la note d'historique.

Conclusion

Je n'ai pas pu détailler tout le brevet tant le nombre de facteurs et de précisions est important. En effet, il fait appel à de nombreuses connaissances et implique d'autres brevets dans ses calculs mais l'essentiel était de montrer deux choses, et j'espère avoir réussit cette mission :

  1. Prouver que l'historique et l'ancienneté des documents influence réellement le positionnement des pages.
  2. Démontrer que ce n'est pas seulement l'âge des pages qui favorise la note d'historique, mais bien les éléments qui composent la vie d'une page au fur et à mesure du temps (profil des liens, taux de modifications et de mises à jour, croissance forte ou régressive, etc.)

11 commentaires

  • IFDP dit :

    Il y a déjà un endroit où l'historique des recherches joue un rôle important sur les SERP c'est pour sortir (pour les requêtes qui en donnent) les résultats des recherches associées.

  • Pullseo dit :

    Il est clair que l'historique d'un site joue un rôle. Mais nous avons toujours estimé (sans pouvoir le prouver par A+B), voire constaté dans notre expérience, que les sites avec un long et "bon" historique (sans pénalités) pouvaient se permettre quelques sur-optimisations sans se prendre de pénalités. Mais cela ne signifie pas que l'on peut faire n'importe quoi :).

    Petite précision aussi : tous les brevets déposés ne sont pas utilisés...et au moment de leur publication, certains sont déjà obsolètes (même si ce n'est peut-être pas tout à fait le cas de celui-ci).

    • Bien entendu. Je dis souvent dans mes analyses de brevet que rien ne dit que c'est utilisé ou autre.
      Je décrypte des sources, c'est tout, et je tente d'apporter des idées car le prix des brevets justifient souvent le fait que l'idée est fortement envisagée par Google, notamment quand Matt Cutts est dans les créateurs. Après tout, nous nous basons sur la communication alambiquée de Google sans jamais trop savoir si ce qui est dit est vrai ou faux, alors les brevets ne sont pas de plus mauvaises sources, si ce n'est que les systèmes sont détaillés (et souvent ce détail montre que nous ne parlons de choses sans jamais vraiment vérifier nos sources, ce qui paraît inconcevable pour l'ex-archéologue que je suis. :D).

      En tout cas, je suis assez d'accord sur le degré de tolérance accordé aux sites plus anciens tant que les optimisations restent maîtrisées et pas trop abusises... :D

  • Le vertige total! Google numérise le monde entier, nos faits et gestes, mais aussi la moindre modif de virgule sur un article...
    Ont-ils aussi déposé un brevet pour échapper aux brevets?

    • Disons que Google procède intelligemment en déposant des brevets dès qu'ils ont des idées réalisables qui permettent d'améliorer leur moteur de recherche. Certes, cela coûte de l'argent et n'est pas toujours appliqué, mais ces brevets posent au moins les bases de beaucoup de choses...

      Pour info, le brevet précise bien qu'il faut un degré de modification "important" pour que les mises à jour soient comptabilisées. Par exemple, une zone de commentaire est parfois exclue des mises à jour, tout comme une date qui change, etc.

  • C'est flagrant sur les événements récurrents et le tourisme. Là ou beaucoup d'institutionnels préfèrent créer de nouvelles pages chaque année, je constate (à mon niveau géographique) que ceux qui recyclent leurs pages des années précédentes simplement en les mettant à jour apparaissent plus facilement bien placés.

  • Laurent dit :

    L'historique d'un domaine joue énormément, on s'en rend compte tous les jours dans le milieu du nom de domaine expiré. Un nom de domaine avec de l'ancienneté aura un impact énorme en référencement ! c'est une piste que nos clients suivent de plus en plus en utilisant la récupération de domaines sur 4x domaining

  • En effet l'âge du site est aspect très important. Est-ce que l'âge du site n'est pas un des facteurs de la TrustRank?

  • Thierry dit :

    Euh désolé de vous décevoir mais même si l'age du site n'est pas forcément un facteur de trustrank à coup sur il est néanmoins un indice d'autorité et de stabilité pour le référencement donc google mais aussi et surtout pour le visiteur quand il s'agit par exemple de vendre des choses qui valent cher etc... quoi qu'il en soit j'en ai fait l'expérience et avec le même profil de backlinks sur un site 6 ans d'expérience (sans activité) et un nom de domaine tout neuf le tout neuf a toujours 4 pages de retard que je n'arrive pas à rattraper

    • Je n'ai pas dit le contraire, je ne fais que décrypter un brevet, il n'y a aucune interprétation dans mon article ici. Pour le coup, je suis même plutôt d'accord avec vous ! ^^

  • Déposer un commentaire

    Répondre à société offshore Annuler la réponse

    L'adresse de messagerie ne sera pas publiée.* Champs obligatoires