El dataset de MiSonGyny 2025 está compuesto por letras de canciones en español anotadas según presenten o no contenido misógino y, en caso de que así sea, con el tipo de contenido (violencia, sexual u odio).
Idioma(s)
Español
Enlace descripción Dataset
Año
2025
Anotaciones
Cada instancia está etiquetada como misógina (M) o no misógina (NM) para la tarea de clasificación binaria. En los casos en los que se identifica misoginia, la instancia se anota además con una o más categorías específicas —Sexualización (S), Violencia (V), Odio (H) o No relacionado (NR)— para la tarea de clasificación de grano fino. Las etiquetas se asignaron mediante un esquema de votación mayoritaria.
Formato
csv
Acceso a datos
Registro
Enlace acceso a datos
Publicación
Alcántara, T. et al. 2025. Overview of MiSonGyny at IberLEF 2025: Misogyny Speech Detection in Spanish Language Song Lyrics. Procesamiento del Lenguaje Natural, 75, pp. 441-451.
Enlace publicación
NLP Topic
Número de unidades
2631
Documentos
2631
Tamaño
2631.00MB
Tamaño set entrenamiento
2105
Tamaño set evaluación
526
- Inicie sesión o registrese para enviar comentarios

