John Mueller a indiqué sur Twitter qu'avoir de multiples balises <title> ne pose pas problème pour Google désormais car le moteur sait très bien gérer ces cas et et parce que la balise a perdu de la valeur depuis le temps. Dans le même temps, Gary Illyes a indiqué sur le réseau social qu'avoir des contenus dupliqués entre des PDF et des pages web ne pose pas de problème non plus.
Cas des title multiples sur Google
Revenons sur le premier cas, nous sommes en droit de nous demander pourquoi John Mueller indique qu'avoir des <title> multiples est toléré. En effet, bien que le facteur ait moins de valeur qu'auparavant, multiplier les balises de titre peut constituer du spam en théorie. Voici les mots du porte-parole de Google :
Ce qui ne fait pas sens pour Google serait sans doute illogique pour les autres également. Cela ne pose aucun problème pour nous, donc si vous en avez besoin (de multiples title, NDLR) pour quelque chose d'autre, allez-y !
La seule explication qui me semble opportune dans ce cas serait de demander à John Mueller quel titre l'emporte dans la masse pour le moteur de recherche. Si cela fonctionne comme pour les ancres de lien, c'est la première mention qui devrait être considérée comme le titre. Pour les autres <title>, nous pouvons aussi nous demander à quelle sauce ils sont manger. En effet, les mots clés sont-ils pris en compte à valeur équivalente ou non ? Les autres titres sont-ils ignorés ? Quoi qu'il en soit, aucune sanction ne semble infligée
Ce qui me surprend là-dedans, c'est que Google maintient le fait que les balises <h1> doivent être uniques par page, au détriment des recommandations du W3C en HTML 5 (qui en autorise plusieurs par page). Google serait capable de distinguer les <title> et de "tolérer" leur présence multiple mais en serait incapable dans le cas des <h1> ? Cette déclaration me semble très étonnante... Certes, les divers brevets sur le spamdexing ou le keyword stuffing montrent qu'en général, Google ignore les contenus spammy avant d'opter pour une éventuelle sanction. Dans ce cas, les autres <title> ou autres <h1> seraient tout bonnement ignorés (ou non valorisés si vous préférez, car il n'est pas toujours aisé et logique d'ignorer des morceaux de contenus via un robot), mais selon John Mueller, il y aurait une distinction entre les deux entités. Bizarre...
Duplicate content entre PDF et pages web : pas de problème pour Google
Gary Illyes a répondu sur Twitter à un internaute qui se demandait si le fait d'avoir exactement les mêmes contenus entre des fichiers PDF et des pages web peut poser des problèmes de contenus dupliqués. Le googler a répondu par la négative :
Vous ne devez pas beaucoup vous inquiéter au sujet de la duplication de site.
Pour tout dire, je suis bien placé pour rencontrer ce problème en tant que gérant d'un organisme de formation. Les programmes de formation sont souvent dupliqués entre les pages web des sites de formation et les PDF à télécharger sur le plan administratif. Au tout début, je m'efforçais de rédiger des contenus différents mais depuis 4 ans et une mini-refonte de mon site, j'ai pris le parti de dupliquer les contenus, et cela n'a jamais joué en ma défaveur (ni en ma faveur d'ailleurs. :D).