MiSonGyny-2025

El dataset de MiSonGyny 2025 está compuesto por letras de canciones en español anotadas según presenten o no contenido misógino y, en caso de que así sea, con el tipo de contenido (violencia, sexual u odio).

Idioma(s)
Español
Año
2025
Anotaciones
Cada instancia está etiquetada como misógina (M) o no misógina (NM) para la tarea de clasificación binaria. En los casos en los que se identifica misoginia, la instancia se anota además con una o más categorías específicas —Sexualización (S), Violencia (V), Odio (H) o No relacionado (NR)— para la tarea de clasificación de grano fino. Las etiquetas se asignaron mediante un esquema de votación mayoritaria.
Formato
csv
Acceso a datos
Registro

Publicación
Alcántara, T. et al. 2025. Overview of MiSonGyny at IberLEF 2025: Misogyny Speech Detection in Spanish Language Song Lyrics. Procesamiento del Lenguaje Natural, 75, pp. 441-451.
NLP Topic
Número de unidades
2631
Documentos
2631
Tamaño
2631.00MB
Tamaño set entrenamiento
2105
Tamaño set evaluación
526

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.