Nous savons depuis quelques mois (voire années ?) que Google sait lire les URL inscrites au sein des contenus, même lorsque ces dernières ne sont pas insérées dans des balises <a> avec des ancres précises. En son temps, Google avait indiqué que la récupération des URL dans les textes permettait au moteur de recherche d'améliorer son crawl en vue des adresses web que le robot devrait visiter. Il faut bien avouer que techniquement, récupérer une URL dans un texte est un jeu d'enfant, alors pour Google, vous n'imaginez pas... :-)
Toutefois, la question du PageRank s'est souvent posée pour ces URL issues des contenus. Bien qu'il semble étonnant que Google transmette du jus de liens via des "liens de texte", la réponse officielle méritait d'être obtenue (bien que la méfiance doive toujours être de mise avec les déclarations parfois discordantes des Googlers...). Voici l'échange avec John Mueller sur Twitter autour de cette question.
@AGr4ves @methode We can pick up links from text too, but they don't pass PR, so no disavow necessary.
— John Mueller (@JohnMu) 26 Octobre 2015
La traduction est simple et sans équivoque, mais nous l'analyserons par la suite :
Nous pouvons aussi récupérer les liens provenant des textes, mais ils ne transmettent pas de PageRank, donc aucun désaveu n'est nécessaire.
La réponse de John Mueller porte à confusion, et non sur le fait que ces liens de texte ne transmettent pas de PageRank. En ce qui me concerne, c'est plutôt la fin du tweet qui me laisse perplexe. En effet, pourquoi aucun désaveu ne serait nécessaire pour ces liens textuels ? Cela signifie donc qu'ils ne sont finalement lus que pour le crawl, comme lorsque cela avait été annoncé auparavant ? Il faut supposer que oui, donc cela aurait au moins le mérite de confirmer ce qui avait été déjà dit naguère... En revanche, admettons que nous cherchions la petite bête. Quelle est le rapport entre PageRank et désaveu (le "so" fait la liaison dans la phrase...) ? Si vous posez un lien de mauvaise qualité (répréhensible par Google Penguin) et que celui-ci est en "nofollow", il ne transmet théoriquement aucun PageRank, donc si je prends au pied de la lettre les mots de John Mueller, cela signifie qu'il ne sert à rien de le désavouer ? Dans ce cas, seuls les liens en "follow" sont répréhensibles par Google Penguin ? Certes, le porte-parole de Google ne fait que répondre à la question du twittos, mais cela peut induire en erreur la communauté SEO (et pas que...). J'ai donc posé la question et si j'obtiens une réponse précise, je vous ferais un retour prochainement...
Mise à jour du 28 octobre 2015
Comme je l'évoquais hier, un doute était permis à propos de l’ambiguïté de la phrase de John Mueller. Je lui ai donc demandé si le fait d'avoir un lien de mauvaise qualité dans un texte (et non dans une balise HTML <a>) peut entraîner une pénalité. Il m'a répondu un peu à côté de la question, et sa réponse risque de ne pas semer le doute que j'ai soulevé :
@Formation_web @methode If they don't pass PR, they'd be similar to nofollow / disavowed links. — John Mueller (@JohnMu) 28 Octobre 2015
En d'autres termes, si un lien ne transmet pas de PageRank, il est considéré comme un nofollow ou un lien désavoué, ce qui est le cas des liens de texte. C'est dommage qu'il n'y ait pas eu plus de précisions car les sous-entendus sont gênants. Et pour cause, cela voudrait dire que tout lien qui ne transmet pas de PageRank, quelle que soit sa forme, ne risque rien pour Google Penguin.
Ce n'est pas illogique, mais cela signifie que je peux pourrir un site avec des liens minables sans être sanctionné par le filtre de pénalité ? Pourquoi pas après tout puisque cela ne fera aucun mal à l'algorithme, mais c'est assez étonnant comme choix. En gros, seuls les spammeurs qui mettent des liens en follow peuvent être pénalisés.