Comment Google classe-t-il les publications des réseaux sociaux ?

Article rédigé par Mathieu Chartier

Publié par dans Référencement le 19 octobre 2014

2 Commentaires

Le référencement et le suivi des réseaux sociaux sont deux sujets qui me passionnent au point de devenir les sujets principaux de mes différents livres, c'est donc avec un certain plaisir que je vous présente un mix des deux thématiques avec le brevet de Google publié le 17 avril 2014 et intitulé judicieusement "Ranking Social Network Objects".

Il s'agit d'un document datant initialement de 2007 mais remis à jour plusieurs fois jusqu'à cette dernière version. L'objectif du brevet est de montrer comment Google fait pour classer les divers types de publications postées sur les réseaux sociaux. En effet, la firme admet que les algorithmes classiques ne peuvent pas suffire pour classer des "objets" de toutes sortes sur les plates-formes sociales :

"They generally rely solely on measures of value extrinsic to an online social network such as the location and frequency of keywords on a particular page. These metrics, however, do not by themselves reflect the value of an object in a social network."

Méthode de classement des publications sur les réseaux sociaux

La technique de Google pour classer et noter les différents types de publications sociales est assez claire, les robots internes sont chargés récupérer les données, de déterminer leur type puis de calculer leur "object score".

Parallèlement à ce classement classique de résultats, Google tente de déterminer une note "relative" au type de publication affichée. En effet, les objets peuvent être mélangés et classés par leur note mais ils doivent aussi avoir un classement propre dans leur thématique propre. Par exemple, une publication fortement notée peut apparaître en haut de classement mais aussi gagner sa place dans des catégories spécifiques comme "les meilleures publications", etc.

Classement des publications sur les réseaux sociaux selon Google.Qu'est-ce qu'un objet social selon Google ?

Google insiste sur le fait que les publications des réseaux sociaux ne peuvent pas se résumer à de simples "textes" dans lesquels les mots clés sont la seule base de classement. Le moteur de recherche social tente donc de déterminer de quel type de posts il s'agit. La firme donne une liste de ces "objets" sociaux :

  • Forums de discussion
  • Communauté d'utilisateurs (groupes)
  • Publication de blog

Cela ne serait pas complet car Google identifie également l'auteur comme un objet à part entière des réseaux sociaux. Dans les facteurs que nous allons voir ci-dessous, nous pouvons avoir des rappels de ce que j'avais déjà évoqué début 2014 en présentant le brevet mentionnant l'Author Rank.

Le tableau ci-dessous est une traduction des listes (non exhaustives d'après le brevet) de critères pris en compte pour noter les divers types de publications sociales.

Type d'objet Facteurs
Forum l'ancienneté de la publication
la publication en elle-même (mots clés ?)
le nombre de réponses
l'heure des réponses (et la date donc)
le nombre de vues
la note de la thématique (autorité du sujet)
l'heure des "vues" (lorsqu'un utilisateur lit le post)
l'autorité de l'auteur de la publication
l'autorité de la communauté de l'auteur
Utilisateur la date d'inscription au service
le nombre d'amis
le nombre de fans
les notes des membres (amis, abonnés...)
le nombre de vues du profil
le fait d'avoir une photo de profil
le ranking de la page de l'utilisateur ("Page rank")
tout ce qui touche les messages ou sujets (nombre, autorité du sujet...)
Communauté le nombre de membres
le page rank total de tous les membres
la qualité des pages web de la communauté
le nombre de pages vues dans la communauté
l'autorité de la communauté
la qualité des pages web partagés
le page rank total de tous les messages postés
Blog Entry le nombre de vues
le nombre de réponses
le page rank de la publication

Sachez qu'il existe des systèmes de pondération appliqués aux différents critères lorsque ces derniers ne peuvent pas être calculés comme il se doit notamment.

Quelques exemples d'algorithmes de classement...

Le brevet présente enfin quelques formules mathématiques et algorithmiques pour présenter ses méthodes de notation des publications sociales. Autant être honnête, il faut être assez doué dans ces domaines pour les déchiffrer, et j'avoue avoir des limites à ce sujet... :D

Un des principaux facteurs de positionnement des publications dépend de leur ancienneté. Google détermine ceci avec la formule suivante :

y = ft ) = e -Δt

Delta T détermine le temps passé depuis l'heure de publication. "y" est le facteur d'événements et sa note dépend d'une décroissance exponentielle au fur et à mesure que les publications "vieillissent".

Pour des raisons techniques évidentes en MathML, il m'est difficile de vous présenter les autres exemples de formules sans en faire une capture. Tous les exemples ci-dessous déterminent donc les scores de différents types d'objets sociaux selon les critères préétablis.

Classement (ranking) des objets sociaux sur Google

J'espère que cette description succincte des notations de publications sociales vous aura satisfait, j'en retiens surtout un élément essentiel. Lors de mes pérégrinations au sein des brevets, j'ai noté trois fois que les critères de notation des "auteurs" (ou utilisateurs ici) sont souvent identiques. Google a même fait récemment un rappel du brevet décrivant l'Author Rank au sein d'un brevet déposé et publié mi-2014, il ne faut donc pas croire que la fin de l'AuthorShip signe déjà l'arrêt de mort de la notation des utilisateurs/auteurs.

Blog web d'Internet-Formation et Mathieu Chartier
Les 3 précédentes publications

Google PageSpeed, vitesse de chargement des pages et nouveautés HTML 5

Publié par Mathieu Chartier dans Référencement le 27 septembre 2014 - 5 Commentaires

Le débat sur la vitesse de chargements des pages web existe depuis des années et l’arrivée du PageSpeed de Google. Les référenceurs ont toujours été partagés à ce sujet et estiment parfois que ce facteur n’est pas réellement pris en compte dans le positionnement des pages. Dans cet article, nous allons penser avant tout à nos utilisateurs et garder en trame de fond l’idée d’un meilleur référencement en voyant quelques innovations futures en HTML 5.
Quelle différence entre PageSpeed et [...]

Un Knowledge Graph évolué sur Google avec des sources variées ?

Publié par Mathieu Chartier dans Référencement le 6 septembre 2014 - 7 Commentaires

Je déambulais ce matin au travers des brevets Google lorsque je suis tombé sur l’un d’entre eux intitulé “User interface for query engine” publié le 8 mai 2014 et dont le nom m’a intrigué. Ne vous attendez pas un scoop de malade comme celui de la prise en compte de l’HTTPS comme critère de positionnement mais plutôt à une petite nouveauté sympathique associée à la notion de Knowledge Graph.
Obtenir des informations générales sur des personnalités ou lieux
Saviez-vous qu’il [...]

Créer une page de partenaires WordPress sans plugin

Publié par Mathieu Chartier dans Programmation le 21 août 2014 - 6 Commentaires

Les sites de présentation (ou « sites vitrines » si vous préférez) nécessitent souvent une page qui liste les partenaires ou sponsors afin de faire partager aux visiteurs et clients potentiels les marques et les organismes (entreprises, associations…) qui nous accompagnent.

Nous allons tenter de créer une page pour « partenaires » entièrement personnalisable en CSS sans plugin WordPress pour se faciliter la vie. Il existe bien entendu des extensions qui répondent à ce besoin mais l’accumulation d’extension n’est pas toujours un gage de [...]