El conjunto de datos DIMEMEX está compuesto por un conjunto de memes anotados manualmente en función de la presencia de contenido abusivo, recopilados de grupos públicos de Facebook en México dedicados a la distribución de este tipo de contenido.
Language(s)
Spanish (Mexico)
Dataset description link
Year
2024
Domain
Social
Annotations
Cada instancia incluye dos etiquetas: una indicando si contiene contenido inapropiado o de odio, y otra indicando, en caso afirmativo, el tipo de lenguaje de odio.
Format
csv
Publication
Jarquín-Vásquez et al. (2024). Overview of DIMEMEX at IberLEF 2024: Detection of Inappropriate Memes from Mexico. Procesamiento del Lenguaje Natural, Revista, 73: 335-345.
NLP Topic
Number of units
2586
Type of units
Documents
Training set size
2263
Test set size
323

