Bing profite de l’IA pour créer les Next Phrase Prediction, la mise en surbrillance et les People Also Ask

Mathieu Chartier SEO 0 commentaire

Bing a publié le 23 septembre 2020 quelques changements pour son moteur de recherche à l'aide de l'intelligence artificielle et de la meilleure compréhension du langage naturel (NLP). Microsoft et Bing profitent des nouvelles avancées en matière de Deep Learning, notamment avec la construction de leur propre modèle de compréhension appelé Turing Natural Language Generation (T-NLG) et l'utilisation de GPT-3 d'OpenAI (réseau de neurones et modèle linguistique de dernière génération).

En production, Bing s'appuie sur le Turing Natural Language Representation (T-NLR) afin d'afficher le résultat de ses modèles entraînés et utilisés par des algorithmes (pour faire un résumé simple...). L'ensemble de ces modèles permet de considérablement améliorer la compréhension du langage naturel mais aussi de proposer aux utilisateurs de nouvelles fonctionnalités intéressantes, tirant profit de l'intelligence artificielle.

Bing souhaite étendre les avancées de ses technologies au-delà des pays en langue anglophone. Certaines fonctionnalités sont déjà prêtes et déployées dans plus de 200 pays et 100 langues, mais le modèle Turing Natural Language Generation doit encore s'améliorer dans certaines langues pour être en production partout dans le monde.

Par exemple, les réponses intelligentes (Position 0) dans les SERP de Bing sont déjà traduites automatiquement dans plus de 100 langues. En revanche, les modèles de prédiction demandent encore de l'apprentissage pour être aussi précis et à l'aise dans toutes ces langues.

Next Phrase Prediction pour améliorer l'autosuggestion de Bing

Pour commencer, Bing va faire évoluer l'auto-complétion du moteur de recherche avec la technologie Next Phrase Prediction. Habituellement, lorsqu'une requête est tapée par un utilisateur, l'autosuggestion propose des phrases toutes faites reprenant les premières lettres (ou premiers mots) tapés basés sur les requêtes récentes les plus populaires. De ce fait, les requêtes suggérées sont toujours issues de ce qui semble le plus demandé à partir d'une requête partiellement tapée. De plus, il était souvent problématique de compléter des requêtes longues à cause de ce phénomène, et souvent, cela consistait à proposer à chaque fois une suggestion pour le dernier mot de la phrase tapée, encore une fois basée sur le succès des requêtes passées.

Avec Next Phrase Prediction, le modèle de deep learning permet de suggérer des phrases complètes en temps réel, sans être basées sur les requêtes historiquement les plus recherchées. Il s'agit de prédire ce qu'un utilisateur souhaiterait taper, au fur et à mesure de la frappe. Tout l'enjeu des modèles linguistiques réside justement dans cette capacité à anticiper (ou deviner) les mots ou expressions qui pourraient coller avec le contexte qui les précède. Le "G" (pour "génération") du modèle T-NLG n'est donc pas innocent, cela permet à la technologie Next Phrase Prediction d'envisager les termes qui vont suivre lors de la frappe d'une requête, et donc d'améliorer considérablement les propositions d'auto-complétion mais aussi l'expérience utilisateur. Nul doute qu'il s'agit d'un premier pas très intéressant en direction des suggestions automatiques en temps réel, basées sur le contexte et non sur le passé (via des requêtes précédemment à succès).

Next phrase Prediction devrait donc permettre de répondre au plus près des requêtes en cours de phrase, et permettre d'améliorer l'autosuggestion des requêtes longues avec la même qualité et la même pertinence, ce qui n'était pas forcément le cas avec l'ancien modèle.

Bing améliore l'autocomplétion avec Next Phrase Generation

Mise en surbrillance des réponses aux questions dans les snippets

Une autre innovation apportée par les modèles de deep learning et par Bing se retrouve dans les snippets présents dans les SERP. Souvent, les mots clés mis en évidence dans les descriptifs de résultats dépendant des mots tapés dans la requête. Si cela peut sembler pertinent dans bien des cas, afin de mettre en exergue les correspondances sémantiques, ce modèle n'est pas le plus adapté quand il s'agit de questions posées.

Pour améliorer l'expérience utilisateur, Bing a donc décidé de lancer la Semantic Highlighting (mise en évidence sémantique). Ce système permet d'afficher en surbrillance les réponses aux questions dans les descriptifs (snippets), et non les mots clés de la question (requête). En effet, si nous demandions à un moteur de recherche "En quelle année sommes-nous ?", il est plus intéressant de mettre en avant "2020" que les mots "en", "quelle", "année" (...). Bing a donc amélioré la technologie de surbrillance pour mettre en avant les réponses aux questions quand cela est pertinent, et c'est une excellente idée.

Dans cette première capture, il est demandé la taille de la population en Allemagne. Bing affiche en surbrillance la réponse "81 452 631 d'habitants à la fin 2019".

Mise en surbrillance des réponses dans Bing

Ici, il est demandé à partir de quelle température la fièvre peut être assimilée à un symptôme du coronavirus. La réponse est mise en gras (38°C) directement dans le snippet, et non les mots clés de la question.Mise en surbrillance des réponses dans Bing

Amélioration des People Also Ask (requêtes connexes)

Bing peut répondre à de nombreuses questions dont il connaît déjà les réponses depuis longtemps. Malheureusement, dans certains contextes et pour certaines requêtes, il est plus difficile pour le moteur de recherche de fournir suffisamment de questions/réponses connexes. Avec les modèles d'IA, Bing peut désormais générer des paires de questions/réponses ex-nihilo, à partir de l'analyse des milliards de documents qu'il connaît. De ce fait, le moteur est capable de fournir bon nombre de People Also Ask pertinentes pour un plus grand nombre de requêtes, tout en restant pertinent grâce à la précision de ces modèles entraînés.

Dans la capture suivante, la réponse est générée à partir des modèles de deep learning, et la source d'inspiration est citée (URL) afin d'aider au mieux les utilisateurs. Ainsi, Bing espère combler le manque de questions/réponses qui pouvait se produire pour moult requêtes.

Génération de réponses et questions pour les People Also Ask