MINA-BR: base de dados para identificação de discurso de ódio contra a mulher na internet
Abstract: A base MINA-BR é composta de três datasets principais. O dataset "MINA-BR" consiste num conjunto de comentários retirados da Internet em português do Brasil, com foco específico em textos direcionados a mulheres. O dataset "MINA-BR Rotulada" contém uma parcela dos comentários do dataset "MINA-BR" rotulados por três anotadores distintos, resultando em comentários classificados como ÓDIO (1) ou NÃO ÓDIO (0). Os comentários também foram rotulados como OFENSIVOS (1) ou NÃO OFENSIVOS (0). Finalmente, o dataset "MINA-BR Anotadores" contém informações sobre o perfil dos rotuladores.
External IDs:doi:10.25824/redu/mqd68z
Loading