MiSonGyny-2025 | Portal ODESIA

El dataset de MiSonGyny 2025 está compuesto por letras de canciones en español anotadas según presenten o no contenido misógino y, en caso de que así sea, con el tipo de contenido (violencia, sexual u odio).

Idioma(s)

Español

Enlace descripción Dataset

https://zenodo.org/records/15591063

Año

2025

Anotaciones

Cada instancia está etiquetada como misógina (M) o no misógina (NM) para la tarea de clasificación binaria. En los casos en los que se identifica misoginia, la instancia se anota además con una o más categorías específicas —Sexualización (S), Violencia (V), Odio (H) o No relacionado (NR)— para la tarea de clasificación de grano fino. Las etiquetas se asignaron mediante un esquema de votación mayoritaria.

Formato

csv

Acceso a datos

Registro

Enlace acceso a datos

http://zenodo.org/records/15591063

Publicación

Alcántara, T. et al. 2025. Overview of MiSonGyny at IberLEF 2025: Misogyny Speech Detection in Spanish Language Song Lyrics. Procesamiento del Lenguaje Natural, 75, pp. 441-451.

Enlace publicación

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6766

NLP Topic

detección de odio

Número de unidades

2631

Documentos

2631

Tamaño

2631.00MB

Tamaño set entrenamiento

2105

Tamaño set evaluación

526

Inicie sesión o registrese para enviar comentarios