We stand with Ukraine

Aller à la racine des fake news avec le NLP

Odile Durand - 1 mars 2022

L’information est essentielle au bon fonctionnement d’une société. Elle informe les gens sur des sujets importants et leur permet de se forger une opinion sur ces sujets. Les informations que les gens consomment peuvent exercer une influence considérable. S’il incombe aux médias d’établir la confiance et la crédibilité, ces valeurs ne sont qu’une partie de l’équation lorsqu’il s’agit de discerner les vraies informations des fausses.

Malheureusement, il n’existe pas de solution miracle contre les fake news. Il n’y a qu’un engagement à comprendre des informations, ou ce qui se fait passer pour de l’information, pour ce qu’elles sont vraiment. Un tel engagement demande beaucoup de temps et de ressources, dont peu de gens disposent réellement.

Bywire News s’est donné pour mission de lutter contre les fake news et a adopté une approche unique via l’intelligence artificielle. Nous avons discuté de cette approche dans notre NLP Stream avec Michael O’Sullivan, PDG de Bywire News, et Jetze Sikkema, Directeur technique. Voici ce que nous avons appris :

Quelques clés pour identifier les fake news

L’une des plus grandes préoccupations concernant les fake news est la façon dont elles se sont répandues. Il existe non seulement un nombre incalculable de sources d’information, mais aussi un nombre exponentiel de plateformes médiatiques sur lesquelles elles peuvent diffuser leurs informations. Pour faire face à cette quantité excessive de contenu, il faut trouver une solution capable de gérer ce niveau d’échelle.

Bywire News a construit le premier composant de sa solution en identifiant cinq éléments d’information essentiels. Ceci a été rendu possible par l’API NL d’expert.ai, qui a permis d’évaluer les éléments suivants :

Éléments clés

Pour commencer, vous analysez un article pour identifier les principaux lemmes, ou mots-clés, qu’il contient. Cela vous aide à établir les éléments de base qu’un véritable article d’actualité sur le sujet devrait inclure.

Entités

La couche suivante que l’algorithme prend en compte est celle des entités contenues dans un article. Alors que les éléments permettent de comprendre le sujet d’un article, les entités révèlent les personnes, les lieux et les choses qui sont les plus importants pour l’histoire.

Sentiment

Alors que les deux premières couches vous aident à déterminer le sujet principal d’un article, le sentiment permet d’identifier son intention. Alors que les vraies nouvelles ont pour but d’informer, les fake news ont pour but de persuader. En mesurant le score de sentiment d’un article, vous pouvez déterminer si le langage utilisé penche fortement dans une direction positive ou négative, ce qui indique une tentative d’influence.

Répétition

La répétition est un thème commun que l’on retrouve dans les contenus destinés à influencer les lecteurs. Alors que les vraies nouvelles ont tendance à être fluides et à exposer les faits, les fake news utilisent la répétition de mots ou de phrases pour les ancrer dans l’esprit des lecteurs. Ce phénomène, connu sous le nom d’effet de vérité illusoire, est un élément essentiel du langage persuasif.

Complexité lexicale

La dernière couche de cet algorithme exploite la complexité lexicale d’un article ou, plus simplement, la qualité de l’écriture. Un article bien écrit ne garantit pas l’authenticité de l’information, mais un article mal écrit est un signal d’alarme clair indiquant que l’article peut être faux. Bien entendu, cela dépend également du public visé et de l’âge des personnes qui le composent.


Ces cinq facteurs portent tous sur le langage utilisé dans un article et constituent une base solide pour distinguer les vraies nouvelles des fausses. Toutefois, ils ne disent pas tout. Pour s’appuyer sur cette base, Bywire News utilise son propre algorithme propriétaire pour examiner des facteurs importants tels que :

  • Quelles sont les sources d’information de l’article ? L’auteur utilise-t-il des sources externes ou se contente-t-il de renvoyer à du contenu interne ?
  • Quelle est la réputation de l’auteur de l’article ? Est-il connu pour diffuser de fausses informations ? Écrivent-ils généralement de manière fortement positive ou négative ?
  • Le contenu (image, vidéo…) utilisé dans un article est-il fortement modifié ? A-t-il été modifié par rapport à l’original ?

Bywire utilise ces facteurs et d’autres pour générer un score, ou indice de confiance, qui détermine le degré d’authenticité d’une information. L’entreprise utilise ensuite ce score pour s’assurer que le contenu de son site Web est authentique et digne de confiance.

Les consommateurs doivent avoir confiance dans les informations qu’ils lisent. S’ils ne peuvent pas faire confiance aux réseaux et aux journalistes pour partager des informations honnêtes, il est essentiel qu’ils disposent d’un moyen de bâtir cette confiance pour eux. Bywire News est un excellent exemple de ce type de solution. Il montre comment la technologie du langage naturel peut réduire le pouvoir des fake news.

Essayez l'API NL d'expert.ai

Bywire News n'est qu'un exemple de ce qu'il est possible de faire avec l'API expert.ai NL. Découvrez toutes les fonctionnalités disponibles.

Tester l'API