Gmail utilise OCR pour lire les textes dans les images

Mathieu Chartier Actualités web 0 commentaire

Gmail n'est pas seulement un webmail qui propose d'écrire des emails, il possède aussi un moteur de recherche interne qui lui permet de fouiller au sein même des textes contenus dans les images. Cela n'est pas nouveau mais peut-être ne le saviez-vous pas. En effet, Gmail lit le texte contenus dans les images, sous plusieurs formes. John Mueller, porte-parole de Google, a d'ailleurs partagé un article sur Twitter le 18 janvier 2018 à ce sujet.

Google s'appuie sur la technologie OCR (optical character recognition) pour capter et lire les textes contenus dans des images. Ce qui est intéressant, c'est de constater que Gmail n'est pas seulement capable de lire des textes rédigés avec des polices web-safe (arial, helvetica...), mais même des textes de notices ou en écriture manuscrite.

Le blog Labnol qui a rapporté ses propres tests affichent des captures intéressantes. Je ne vous en rapport qu'une infime partie pour voir à quel point Gmail peut rechercher loin dans les textes des images.

Exemple avec une lecture dans un email avec une image écrite en manuscrit.

Gmail sait lire dans les images du texte écrit en écriture manuscrite

Exemple avec la lecture d'une notice technique.

Gmail utilise la technologie OCR pour lire dans les emails et les notices techniques

Il faut savoir que cette technologie OCR est également utilisée dans Google Drive et Google Keep notamment, et pourrait peut-être se propager dans d'autres outils ou services de Google. On peut même se demander si cela n'aurait pas un sérieux intérêt pour Google Images notamment, voire pour le référencement naturel classique. J'avais demandé début 2017 à John Mueller si les textes des images étaient lus dans Google Images et il m'avait répondu que non, mais la donne pourrait peut-être changer...

Si la technologie OCR vous intéresse, vous pouvez utiliser l'API Google Cloud Vision ou la Microsoft's Computer Vision API. En tout cas, cela démontre les progrès effectués en matière de reconnaissance des formes et des textes dans les images !