A Neurosymbolic Model Using Genre, Topic, and Persuasion Techniques to Improve Robustness in Classification

Géraud Faye; Benjamin Icard; Morgane Casanova; Guillaume Gadek; Guillaume Gravier; Wassila Ouerdane; CELINE HUDELOT; Sylvain Gatepaille; Paul Égré

A Neurosymbolic Model Using Genre, Topic, and Persuasion Techniques to Improve Robustness in Classification

Géraud Faye, Benjamin Icard, Morgane Casanova, Guillaume Gadek, Guillaume Gravier, Wassila Ouerdane, CELINE HUDELOT, Sylvain Gatepaille, Paul Égré

Published: 28 Apr 2026, Last Modified: 29 Apr 2026TALN 2026 ationtravauxpubliésEveryoneRevisionsBibTeXCC BY 4.0

Titre: Un modèle neurosymbolique fondé sur le genre, la thématique, et les techniques de persuasion pour améliorer la robustesse dans la détection de la propagande

Type Of Submission: Recent Work Published in Major International Conference / Travaux publiés récemment dans les conférences majeures internationales

Keywords: Information disorder, Fake news, Propaganda, Classification, Topic modeling, Hybrid method, Neurosymbolic model, Ablation, Robustness, Explainability

Mots-cles: Désordre informationnel, Fausses nouvelles, Propagande, Classification, Modélisation thématique, Méthode hybride, Modèle neurosymbolique, Ablation, Robustesse, Explicabilité

Abstract: Propaganda detection constitutes a major democratic challenge, particularly with the proliferation of pseudo-news sites that rewrite news articles to broadcast narratives. To detect propaganda, extant approaches based on Language Models such as BERT are promising but often overfit their training datasets, due to biases in data collection. To enhance classification robustness, we propose a neurosymbolic approach combining static fastText embeddings and symbolic conceptual features such as genre, topic, and persuasion techniques, to improve generalization to new sources. Results show improvements over equivalent text-only methods, and explainability analyses confirm the benefits of the added features.

Resume: La détection de la propagande constitue un enjeu démocratique de taille, compte tenu en particulier de la prolifération de sites d'ingérence étrangère diffusant des narratifs sous couvert de nouvelles ordinaires. Pour détecter la propagande, les approches actuelles fondées sur des modèles de langue tels que BERT sont prometteuses, mais tendent souvent à surapprendre leurs jeux de données d’entraînement, en raison de biais introduits lors de la collecte des données. Afin d’accroître la robustesse de la classification, nous proposons une approche neurosymbolique combinant des représentations vectorielles statiques du texte (embeddings fastText) et des caractéristiques conceptuelles symboliques, telles que le genre, le thème et les techniques de persuasion, de manière à améliorer la capacité de généralisation à de nouvelles sources. Les résultats mettent en évidence des gains par rapport à des méthodes équivalentes n’exploitant que le texte, tandis que les analyses d’explicabilité confirment l’apport des caractéristiques ajoutées.

Submission Number: 48

Loading