El corpus español EXIST 2024 es una colección de tuits y de memes etiquetados con información relacionada con el sexismo: si el tweet/meme es sexista, el tipo de intención que muestra el autor del mismo y el tipo de sexismo que se está ejerciendo.
Idioma(s)
Español
Enlace descripción Dataset
Año
2024
Dominio
Social
Anotaciones
Etiqueta binaria que indica si un tuit expresa sexismo, y etiquetas multiclase sobre el tipo de sexismo y la intención del autor.
Formato
json
Enlace guía anotaciones
Acceso a datos
Formulario de registro
Enlace acceso a datos
Publicación
Plaza, L. et al. (2024).EXIST 2024: sEXism Identification in Social neTworks and Memes. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2024. Lecture Notes in Computer Science, volume 14612
Enlace publicación
Licencia
CC-BY-4.0
NLP Topic
Número de unidades
9653
Tipo de unidades
Tuits
Tamaño set entrenamiento
7194
Tamaño set evaluación
1969
Tamaño set desarrollo
490
- Inicie sesión o registrese para enviar comentarios