Comment Google classe-t-il les publications des réseaux sociaux ?

Mathieu Chartier Référencement 10 commentaires

Le référencement et le suivi des réseaux sociaux sont deux sujets qui me passionnent au point de devenir les sujets principaux de mes différents livres, c'est donc avec un certain plaisir que je vous présente un mix des deux thématiques avec le brevet de Google publié le 17 avril 2014 et intitulé judicieusement "Ranking Social Network Objects".

Il s'agit d'un document datant initialement de 2007 mais remis à jour plusieurs fois jusqu'à cette dernière version. L'objectif du brevet est de montrer comment Google fait pour classer les divers types de publications postées sur les réseaux sociaux. En effet, la firme admet que les algorithmes classiques ne peuvent pas suffire pour classer des "objets" de toutes sortes sur les plates-formes sociales :

"They generally rely solely on measures of value extrinsic to an online social network such as the location and frequency of keywords on a particular page. These metrics, however, do not by themselves reflect the value of an object in a social network."

Méthode de classement des publications sur les réseaux sociaux

La technique de Google pour classer et noter les différents types de publications sociales est assez claire, les robots internes sont chargés récupérer les données, de déterminer leur type puis de calculer leur "object score".

Parallèlement à ce classement classique de résultats, Google tente de déterminer une note "relative" au type de publication affichée. En effet, les objets peuvent être mélangés et classés par leur note mais ils doivent aussi avoir un classement propre dans leur thématique propre. Par exemple, une publication fortement notée peut apparaître en haut de classement mais aussi gagner sa place dans des catégories spécifiques comme "les meilleures publications", etc.

Classement des publications sur les réseaux sociaux selon Google.Qu'est-ce qu'un objet social selon Google ?

Google insiste sur le fait que les publications des réseaux sociaux ne peuvent pas se résumer à de simples "textes" dans lesquels les mots clés sont la seule base de classement. Le moteur de recherche social tente donc de déterminer de quel type de posts il s'agit. La firme donne une liste de ces "objets" sociaux :

  • Forums de discussion
  • Communauté d'utilisateurs (groupes)
  • Publication de blog

Cela ne serait pas complet car Google identifie également l'auteur comme un objet à part entière des réseaux sociaux. Dans les facteurs que nous allons voir ci-dessous, nous pouvons avoir des rappels de ce que j'avais déjà évoqué début 2014 en présentant le brevet mentionnant l'Author Rank.

Le tableau ci-dessous est une traduction des listes (non exhaustives d'après le brevet) de critères pris en compte pour noter les divers types de publications sociales.

Type d'objet Facteurs
Forum l'ancienneté de la publication
la publication en elle-même (mots clés ?)
le nombre de réponses
l'heure des réponses (et la date donc)
le nombre de vues
la note de la thématique (autorité du sujet)
l'heure des "vues" (lorsqu'un utilisateur lit le post)
l'autorité de l'auteur de la publication
l'autorité de la communauté de l'auteur
Utilisateur la date d'inscription au service
le nombre d'amis
le nombre de fans
les notes des membres (amis, abonnés...)
le nombre de vues du profil
le fait d'avoir une photo de profil
le ranking de la page de l'utilisateur ("Page rank")
tout ce qui touche les messages ou sujets (nombre, autorité du sujet...)
Communauté le nombre de membres
le page rank total de tous les membres
la qualité des pages web de la communauté
le nombre de pages vues dans la communauté
l'autorité de la communauté
la qualité des pages web partagés
le page rank total de tous les messages postés
Blog Entry le nombre de vues
le nombre de réponses
le page rank de la publication

Sachez qu'il existe des systèmes de pondération appliqués aux différents critères lorsque ces derniers ne peuvent pas être calculés comme il se doit notamment.

Quelques exemples d'algorithmes de classement...

Le brevet présente enfin quelques formules mathématiques et algorithmiques pour présenter ses méthodes de notation des publications sociales. Autant être honnête, il faut être assez doué dans ces domaines pour les déchiffrer, et j'avoue avoir des limites à ce sujet... :D

Un des principaux facteurs de positionnement des publications dépend de leur ancienneté. Google détermine ceci avec la formule suivante :

y = ft ) = e -Δt

Delta T détermine le temps passé depuis l'heure de publication. "y" est le facteur d'événements et sa note dépend d'une décroissance exponentielle au fur et à mesure que les publications "vieillissent".

Pour des raisons techniques évidentes en MathML, il m'est difficile de vous présenter les autres exemples de formules sans en faire une capture. Tous les exemples ci-dessous déterminent donc les scores de différents types d'objets sociaux selon les critères préétablis.

Classement (ranking) des objets sociaux sur Google

J'espère que cette description succincte des notations de publications sociales vous aura satisfait, j'en retiens surtout un élément essentiel. Lors de mes pérégrinations au sein des brevets, j'ai noté trois fois que les critères de notation des "auteurs" (ou utilisateurs ici) sont souvent identiques. Google a même fait récemment un rappel du brevet décrivant l'Author Rank au sein d'un brevet déposé et publié mi-2014, il ne faut donc pas croire que la fin de l'AuthorShip signe déjà l'arrêt de mort de la notation des utilisateurs/auteurs.

10 commentaires

  • Sebastien Menozzi dit :

    Bonjour, est-ce possible de retranscrire ces algorithmes en code php? Moi, personnellement, j'ai essayé mais sans succès. Il y a des choses dans la formule que je ne comprend pas.

  • En effet, Google a ses principes dans le classement des publications dans les réseaux sociaux. Et c'est même la bête noire des Community Manager. Aujourd'hui, l'enjeu n'est pas de publier le bon message au bon moment mais aussi et surtout, de connaître la tendance des mots clés qui sont les plus recherchés dans les moteurs de recherches. Et c’est avec cela que Google peut détecter plus facilement une publication sur les réseaux sociaux.

  • Stéphane dit :

    L'Author Rank est donc un facteur de ranking des publications de réseaux sociaux ? Cela ne m'étonne pas. Google a besoin d'accorder ou pas une confiance à celui qui poste une publication pour pouvoir la ranker pour être plus pertinent. Pourquoi Google a arrêté l'AuthorShip ? Apparemment, pour les réseaux sociaux, il sert encore. Sur les réseaux sociaux, cela semble évident, les publications sont forcément publiées par quelqu'un pour une marque ou à titre personnel. Il n'y a pas "moyen" d'effectuer un post anonyme à l'inverse des contenus de sites web. L'information, pertinente ou non, provient donc d'un profil existant plus ou moins connu ayant de l'influence ou non.

    • Non malheureusement, on ne peut pas être aussi catégorique, je dis juste que si l'AuthorRank existe, je remarque qu'il est évoqué dans des brevets récents. Il n'y a jamais eu d'annonce de la part de Google et la fin de l'AuthorShip sous sa forme ancienne permet de douter.
      Toutefois, l'AuthorRank décrit dans le brevet que j'avais analysé début 2014 ne s'intéresse pas spécifiquement aux réseaux sociaux, donc ça peut aussi sous-entendre qu'il existerait "encore"...

  • Les critères pris en compte par Google sont vraiment nombreux. Sinon, le fait que ces formules soient en français ou en anglais ne change pas grand chose car pour comprendre ces formules, il semble vraiment qu'on doit être très calé en math. Là, on comprend mieux pourquoi on a tellement de mal à décrypter les secrets des algorithmes du moteur de recherche.

  • Tout est-il réductible à des équations mathématiques?
    En météo comme en bourse on sait bien que non: nous sommes dans un système chaotique avec beaucoup trop de variables pour jouer les apprentis-sorciers.
    On peut modéliser les réseaux sociaux un moment mais il y aura toujours un grain de sable pour faire s'envoler le système. Et heureusement car sinon tout serait prévisible, même les équations à 2000 inconnues, y-compris le prénom de sa prochaine rencontre ou la date de sa mort.

  • Très intéressant votre étude sur le classement des publications sur les réseaux sociaux, sujet rarement abordé. Et hop, votre blog est dans mes favoris.

  • Bien que je n'ai rien compris à toutes ces formules mathématiques, j'ai au moyen identifié les variables pris en compte par Google. A voir la liste, c'est vraiment beaucoup. Or, je suis certain que la liste de Google est beaucoup plus longue. En tout cas, ces points sont de véritables indices qu'on peut déjà exploiter. Quoi qu'il en soit, cette étude est vraiment pertinente et on n'en voit beaucoup pas des comme ça. Aussi, merci pour ce partage.

  • fouta dit :

    Merci pour l'article même si pour moi google et le référencement des publication des réseaux sociaux et incompréhensible !

  • Déposer un commentaire

    Répondre à Sebastien Menozzi Annuler la réponse

    L'adresse de messagerie ne sera pas publiée.* Champs obligatoires