El conjunto de datos DIMEMEX está compuesto por un conjunto de memes anotados manualmente en función de la presencia de contenido abusivo, recopilados de grupos públicos de Facebook en México dedicados a la distribución de este tipo de contenido.
Idioma(s)
Español (Mexico)
Enlace descripción Dataset
Año
2024
Dominio
Social
Anotaciones
Cada instancia incluye dos etiquetas: una indicando si contiene contenido inapropiado o de odio, y otra indicando, en caso afirmativo, el tipo de lenguaje de odio.
Formato
csv
Enlace acceso a datos
Publicación
Jarquín-Vásquez et al. (2024). Overview of DIMEMEX at IberLEF 2024: Detection of Inappropriate Memes from Mexico. Procesamiento del Lenguaje Natural, Revista, 73: 335-345.
NLP Topic
Número de unidades
2586
Tipo de unidades
Documentos
Tamaño set entrenamiento
2263
Tamaño set evaluación
323
- Inicie sesión o registrese para enviar comentarios