Titre: Le corpus NeWMe : un corpus de référence pour l’étude de la négociation du sens des mots
Type Of Submission: Recent Work Published in Major International Conference / Travaux publiés récemment dans les conférences majeures internationales
Keywords: Word meaning negotiation, WMN, semantic alignment, semantic coordination, interactional linguistics, misunderstanding
Mots-cles: Négociation du sens des mots, WMN, alignement sémantique, coordination séman- tique, linguistique interactionnelle, malentendu
Abstract: Word Meaning Negotiation (WMN) sequences occur when participants focus on clarifying or negotiating the meaning of a word or phrase. These interactions temporarily shift the conversation to explore nuances of meaning, resulting in quick clarification or extended debates.
This paper presents the largest freely available manually annotated corpus of WMNs. It encompasses spoken dyadic and multiparty conversations as well as online debates. Our methodology combines searching for WMNs using regular expressions with a detailed annotation scheme that distinguishes several types of WMNs, such as those triggered by non-understanding (NONs) or disagreement (DINs), as well as related phenomena.
Our analyses reveal distinct patterns across contexts, with NONs prevalent in spoken interactions and DINs dominating online debates. This resource lays a foundation for the study of semantic alignment and the development of automated WMN detection.
Resume: Les séquences de négociation du sens des mots (*Word Meaning Negotiation*, WMN) apparaissent lorsque des interlocuteurs se concentrent sur la clarification ou la négociation du sens d’un mot ou d’une expression. Ces interactions orientent temporairement la conversation vers l'exploration des nuances de sens, menant à des clarification rapides ou à des débats plus approfondis.
Cet article présente le plus grand corpus de WMN librement accessible annoté manuellement. Il comprend des conversations orales dyadiques et multipartites ainsi que des débats en ligne. Notre méthodologie combine une recherche par expressions régulières avec un schéma d’annotation distinguant plusieurs types de WMN, notamment celles déclenchées par une non-compréhension (NONs) ou un désaccord (DINs), ainsi que des phénomènes connexes.
Les analyses révèlent des tendances selon les contextes : les NONs sont plus fréquentes à l’oral, tandis que les DINs dominent en ligne. Cette ressource contribue à l’étude de l’alignement sémantique et à l’identification des WMN.
Submission Number: 22
Loading