Les Sitemaps XML autorisent 50 Mo d’URL contre 10 Mo, Bing et Google réagissent…

Mathieu Chartier SEO 2 commentaires

Le protocole Sitemap indiquait jusqu'à maintenant que les fichiers sitemap.xml ne devaient pas dépasser les 10 Mo maximum. Désormais, la page officielle du protocole d'aide à l'indexation précise que ces mêmes fichiers peuvent grimper jusqu'à 50 Mo par fichier. Face à cette nouvelle, le moteur de recherche Bing a rapidement réagit, indiquant à ses utilisateurs la prise en compte effective de ce changement intéressant dans certains cas, avant que Google ne dégaine également.

Voici un extrait de la F.A.Q. officielle qui mentionne discrètement ce changement de prise en compte. La taille indiquée est bien de 50 Mo désormais, bien que le nombre d'URL autorisé se maintienne à 50000 adresses web maximum par fichier sitemap.xml.

Amélioration de la taille des fichiers Sitemaps XML

Dans son communiqué, Bing explique en partie ce changement de prise en compte du protocole. La firme précise bien que la majorité des fichiers Sitemap n'atteignent pas l'ex-limite des 10 Mo par fichier, mais avec la recrudescence d'URL à rallonge ou contenant des paramètres (query string) interminables, les fichiers se retrouvent parfois à dépasser cette limite de poids historique. Pour faire face à ces problèmes de plus en plus présents aux yeux du moteur de Microsoft, la firme a décidé d'appliquer le changement instauré par le protocole et de prendre en compte les fichiers Sitemap plus lourds.

En théorie, un fichier Sitemap peut être compressé en Gzip, et dans ce cas, sa taille compressée ne doit pas excéder 50 Mo, c'est ce que précise la documentation officielle du protocole. Toutefois, le moteur américain semble avoir pris une petite liberté à ce sujet puisque le communiqué de Fabrice Canel, responsable du crawl et de l'indexation de Bing, indique que la taille du fichier Gzip décompressé ne doit pas dépasser la nouvelle limite de taille. Certes, cela ne devrait pas fondamentalement changer les choses, mais la nuance est à noter... ;-)

Hormis ce changement, les fichiers Sitemaps XML restent identiques à tout point de vue, avec toujours l'usage de 50000 balises <loc>...</loc> maximum par fichier, la présence optionnelle de trois autres balises descriptives, etc. Pour rappel, le fichier Sitemap peut être soumis dans les outils pour webmaster de Google, Bing, Yandex et Baidu notamment, mais aussi par une directive du fichier robots.txt. Sinon, il est possible d'envoyer une requête "ping" auprès des moteurs de recherche compatibles avec le protocole, sous la forme URL_DU_MOTEUR/ping?sitemap=URL_SITEMAP.XML.

Google a également réagit

Google a publié un tweet sur son compte officiel pour les webmasters afin d'indiquer que le moteur de recherche prend lui aussi en compte la modification de taille des fichiers Sitemaps XML.

2 commentaires

  • Kevin Bouilleaux dit :

    Je pense que les sitemaps c'est surtout quelque chose à utiliser pour le lancement d'un site ou lorsque l'on modifie de manière importante la structure d'un site existant. Après c'est sûr que c'est toujours bien que Google et Bing autorisent de plus gros fichiers.

  • seolius dit :

    Bonjour Mathieu,
    Effectivement je viens d’apprendre cette nouvelle et sincèrement c’est une très bonne décision. Certains sites disposent de milliers d’URL et la limitation de la taille du fichier sitemap au plafond de 10 MO peut poser des problèmes parfois surtout pour les grands sites, places de marché, portails…
    On est habitué à voir le moteur de recherche Google réagir en premier lieu, mais cette fois c’est Bing qui s’est précipité pour annoncer cette nouvelle à ces utilisateurs. Personnellement je trouve que Google n’a pas réagi rapidement parce que pour lui cette nouvelle limite de la taille de sitemap n’aura pas une influence fondamentale et le gain qu’elle apporte est minime du moment que, comme vous l’avez mentionné dans votre article, la majorité des fichiers Sitemap n'atteignent pas la limite des 10 Mo. C’est pour ça il a indiqué cette modification via un simple tweet sur son compte officiel pour les webmasters, sans faire un article ni une vidéo comme d’habitude. En ce qui concerne l’indexation du fichier sitemap, personnellement j’ajoute toujours une directive pour déclarer le chemin sur le fichier robots.txt et hop le tour est joué.
    Et jusque-là je n’ai jamais rencontré un problème avec la limitation de taille du fichier sitemap.xml du moment que tous les sites que j’ai traités, que ce soient les miens ou pour des clients, ont des fichiers sitemap qui ne dépassent pas l’ex-limite de 10 MO. Maintenant qui sait peut-être cette nouvelle taille me servira dans le futur avec des sites beaucoup plus grands.

  • Déposer un commentaire

    Répondre à Kevin Bouilleaux Annuler la réponse

    L'adresse de messagerie ne sera pas publiée.* Champs obligatoires