MINA-BR: base de dados para identificação de discurso de ódio contra a mulher na internet

Hannah De Oliveira Plath, Maria Estela De Oliveira Paiva, Danielle Lanzarini Pinto, Paula Dornhofer Paro Costa

Published: 01 Jan 2025, Last Modified: 07 Nov 2025Repositório de Dados de Pesquisa da UnicampEveryoneRevisionsCC BY-SA 4.0
Abstract: A base MINA-BR é composta de três datasets principais. O dataset "MINA-BR" consiste num conjunto de comentários retirados da Internet em português do Brasil, com foco específico em textos direcionados a mulheres. O dataset "MINA-BR Rotulada" contém uma parcela dos comentários do dataset "MINA-BR" rotulados por três anotadores distintos, resultando em comentários classificados como ÓDIO (1) ou NÃO ÓDIO (0). Os comentários também foram rotulados como OFENSIVOS (1) ou NÃO OFENSIVOS (0). Finalmente, o dataset "MINA-BR Anotadores" contém informações sobre o perfil dos rotuladores.
Loading