Presque 5 ans après avoir publié un article sur un programme similaire en PHP, revoilà donc une nouvelle version plus aboutie et plus complète d'un "wrapper de requête" en Python. L'idée est de pouvoir créer dynamiquement un extrait de texte (snippet) autour d'un mot précis ou d'une requête de plusieurs mots, avec n mots avant et après cette requête. Et si vous le voulez, la fonction est adaptable pour générer une mise en gras de la requête centrale un peu comme le fait Google. :-) [...]
Générer un snippet autour d'un mot précis en Python

Dernières actualités web

Seo Camp Day de la Rochelle (17) le 15 avril 2022

Actualités web

Les événements SEO reprennent de plus bel en présentiel et à distance avec la fin des restrictions sanitaires et la possible accalmie autour du Covid-19. C'est notamment le cas avec le SEO Camp Day de la Rochelle du 15 avril 2022, un événement pour les locaux de l'étape comme moi (vive les poitevins ^^). Et la super nouvelle de l'histoire, c'est que l'événement SEO se déroule dans l'Aquarium de la Rochelle, un lieu à visiter pour toutes celles et tous ceux qui ne l'auraient encore jamais fait. [...]

Derniers articles de fond

Bonne année 2023 et doctorat en cours...

Autour du web

Bonne année et bonne santé 2023 à tous mes chers lecteurs (et cela inclut évidemment mes chères lectrices ! ^^). Je vous souhaite tout le bonheur du monde et que l'année à venir soit riche à tous les niveaux. 2022 a été une année chaotique à bien des égards, notamment sur le plan économique, et il est encore difficile pour beaucoup d'entre nous de relever la tête avec l'espoir d'une année meilleure (l'inflation et la spéculation faisant encore leur œuvre). Dans tous les cas, tentons de positiver et de profiter dans la seule vie qui nous est octroyée ! :-) [...]

Derniers tutoriels

Logo de Buxerolles transparent

Tutoriels illustrés28 septembre 2021

Les animations prennent de plus en plus de place dans le Web actuel, notamment avec les progrès en matière de lecture du format SVG. Ce format vectoriel (non pixellisé, sans perte) est en vogue car il allie à la fois l'esthétisme, la performance et la polyvalence, et nous permet donc de créer des images d'une grande précision, avec possibilité de l'animer à sa guise. [...]

Quand Google vole les contenus de sources externes sans les citer…

Mathieu Chartier SEO 2 commentaires

Google s'est fait prendre la main dans le sac, en plein plagiat (ou vol de contenus), le 8 décembre 2015. Aux Etats-Unis, une Knowledge Card affiche les paroles de chansons et des utilisateurs ont remarqué un bug avec celles du morceau "Hello" de la chanteuse Adèle au sein des SERP. En effet, d'étranges caractères ainsi que des mots étranges ont été repérés et la source originale, non citée par le moteur, a été retrouvée ; il s'agissait de MetroLyrics.

En réalité, Google a récupéré les paroles automatiquement (certainement en scrapant) du site MetroLyrics et ces dernières n'ont pas été retraitées par le moteur, ce qui a permis aux webmasters de remarquer la supercherie et le vol de contenus. Si certains se sont demandés si la source de Google et celle de MetroLyrics n'était pas en cause, la réponse ne s'est pas fait attendre puisque c'est bien le site spécialisé qui a rédigé le texte du morceau d'Adèle, donc aucun doute n'est permis sur ce plagiat déguisé. Pire, Google a même attribué la source à Google Play dans sa fiche dédiée au morceau de la chanteuse britannique...

Google plagie les paroles de chansons du site MetroLyrics

Face au bad buzz qu'a suscité ce vol de contenus, Google a réagit en toute discrétion, supprimant dans un premier temps les paroles sur Google Play avant de les remettre dans une version propre (mais toujours sans source). Malgré toutes les questions qui ont été posées à Google sur cette fâcheuse histoire de vol et de plagiat, la firme n'a toujours rien répondu. Si vos doutes persistaient encore sur la capacité de Google à se servir dans les pages web, vous saurez que cela arrive certainement plus fréquemment qu'on ne le pense...

Paroles de "Hello" d'Adèle supprimée après le vol de contenus de Google chez MetroLyrics