En ce moment

Titre

Artiste

[qt-onairmini]

[qt-onairmini]


Des articles plagiés à l’aide d’outils d’IA générative commencent à apparaître sur Google News

Écrit par le 25 janvier 2024


Pour générer du trafic, des fermes de contenus publient des dizaines d’articles par jour, en utilisant l’intelligence artificielle. Ces articles apparaissent quand même sur Google News.

Des articles plagiés à l'aide d'outils d'IA générative commencent à apparaître sur Google News

Google News est-il suffisamment armé pour lutter contre la prolifération sur Internet d’articles rédigés par des intelligences artificielles génératives ? Non, répond une enquête menée par le site américain 404 Media, qui a identifié plusieurs exemples.

Articles copiés

404 Media mentionne notamment un site baptisé Worldtimetodays, qui se présente comme “l’un des plus grands portails d’actualités en ligne”. Et qui publie plusieurs dizaines d’articles par jour, probablement en demandant à service d’IA générative de réécrire un article trouvé sur un véritable site d’information.

L’enquête de 404 Media cite un article sur les fans de Star Wars. Celui-ci est une copie d’un article publié la veille par le site Distractify. À une différence près : il est truffé de fautes de syntaxe et de tournures de phrase étranges. Et il parle aussi des fans de “war of stars”…

Sur d’autres pages, Worldtimetodays réutilise des images d’illustration contenant encore le nom du site d’origine. Ou il inclut la signature du journaliste qui a rédigé l’article recopié par son IA.

Fermes de contenus

L’existence de ces fermes de contenus, destinées à générer du trafic pour engranger des recettes publicitaires, n’est pas nouvelle. Ni même leur présence sur Google News. Mais les progrès de l’IA générative rendent cette tendance plus problématique, car toutes les fermes ne sont pas aussi mauvaises que les exemples cités par 404 Media.

Les derniers grands modèles de langage permettent en effet de rédiger des contenus de bien meilleure qualité, qui ne se contentent pas de réécrire grossièrement les phrases dans le même ordre. Ils peuvent construire un nouvel article, adaptant une nouvelle structure. Ces contenus sont beaucoup plus difficiles à différencier.

Google minimise

Pour sa défense, Google News expliquent que ces sites ne sont pas “largement mis en avant”, comme le prétend 404 Media. “Les sites en question n’apparaissaient que pour des requêtes artificiellement restreintes, y compris des requêtes filtrant explicitement la date d’un article original”, poursuit le moteur de recherche – ce qui est d’ailleurs confirmé par 404 Media, qui a limité ses recherches sur les dernières 24 heures.

Google assure prendre “très au sérieux” la qualité de ses résultats, privilégiant l’expertise et la fiabilité des articles. La société indique avoir mis en place des “politiques claires contre le contenu créé dans le but principal de bien se classer sur Google News”. Elle promet de “supprimer les sites qui enfreignent ces politiques”. Pour le moment, Worldtimetodays est toujours présent sur la plateforme.

Lien: https://www.usine-digitale.fr/article/des-articles-plagies-a-l-aide-d-outils-d-ia-generative-commencent-a-apparaitre-sur-google-news.N2206786