DIMEMEX

El conjunto de datos DIMEMEX está compuesto por un conjunto de memes anotados manualmente en función de la presencia de contenido abusivo, recopilados de grupos públicos de Facebook en México dedicados a la distribución de este tipo de contenido.

Language(s)
Spanish (Mexico)
Year
2024
Domain
Social
Annotations
Cada instancia incluye dos etiquetas: una indicando si contiene contenido inapropiado o de odio, y otra indicando, en caso afirmativo, el tipo de lenguaje de odio.
Format
csv

Publication
Jarquín-Vásquez et al. (2024). Overview of DIMEMEX at IberLEF 2024: Detection of Inappropriate Memes from Mexico. Procesamiento del Lenguaje Natural, Revista, 73: 335-345.
NLP Topic
Number of units
2586
Type of units
Documents
Training set size
2263
Test set size
323