Google ignore les caractères spéciaux et émojis des ‹title›

Mathieu Chartier SEO 2 commentaires

Lors d'un échange survenu sur Twitter entre un webmaster et John Mueller, le porte-parole de Google a indiqué que les caractères spéciaux et émojis introduits dans les balises <title> sont tout simplement supprimés et ignorés par le moteur de recherche. Cela n'interdit pas aux référenceurs d'ajouter ces types de caractères pour gagner en visibilité, mais ils n'impactent pas directement Google ou le classement des pages.

Tentative d'explication technique

Techniquement, cela s'explique facilement. En effet, Google utilise en partie la recherche en texte intégral (FULLTEXT) qui autorise notamment des opérateurs pour effectuer certaines actions (par exemple : "-mot" pour exclure "mot" de la recherche, "mot|terme" pour chercher l'un ou l'autre des mots, "+mot" pour assurer la présence de l'occurrence dans les résultats, etc.) mais aussi d'autres fonctionnalités qui lui sont propres. La recherche FULLTEXT se compose de plusieurs paramètres côté serveur SQL qui permettent de paramétrer la recherche. Sans tous les citer, voici trois exemples qui permettent en partie d'expliquer comment Google pourrait exclure les caractères spéciaux ou émojis :

  • ft_min_word_len : longueur minimale des mots à rechercher (plus de 3 signes par défaut) ;
  • ft_max_word_len : longueur maximale des mots à rechercher (moins de 255 signes par défaut) ;
  • ft_stopword_file : liste des mots à ne pas rechercher (articles, conjonctions de coordination, émojis...), les fameux "stop words" régulièrement évoqués en SEO.

Loin de moi l'idée de réduire Google à de simples paramétrages d'une recherche en FULLTEXT, j'imagine qu'il y a un pré-traitement qui évalue déjà les <title> et ignore en amont les caractères spéciaux ou émojis. J'ose croire également que les stop words sont triés avant même que SQL ne se charge de la recherche. Mais tout cela précise que dans les faits, il est assez logique que Google ignore ces mots spéciaux sur le plan technique dans les titres. Toutefois, Google et Bing autorisent la recherche par émoji depuis plusieurs mois donc les entités HTML correspondantes semblent valables au sein des contenus... ;-)