DIMEMEX | Portal ODESIA

El conjunto de datos DIMEMEX está compuesto por un conjunto de memes anotados manualmente en función de la presencia de contenido abusivo, recopilados de grupos públicos de Facebook en México dedicados a la distribución de este tipo de contenido.

Language(s)

Spanish (Mexico)

Dataset description link

https://codalab.lisn.upsaclay.fr/competitions/18118

Year

2024

Domain

Social

Annotations

Cada instancia incluye dos etiquetas: una indicando si contiene contenido inapropiado o de odio, y otra indicando, en caso afirmativo, el tipo de lenguaje de odio.

Format

csv

Data link

https://codalab.lisn.upsaclay.fr/competitions/18118#learn_the_details-get_start…

Publication

Jarquín-Vásquez et al. (2024). Overview of DIMEMEX at IberLEF 2024: Detection of Inappropriate Memes from Mexico. Procesamiento del Lenguaje Natural, Revista, 73: 335-345.

Publication link

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/download/6621/4013

NLP Topic

detección de odio

Number of units

2586

Type of units

Documents

Training set size

2263

Test set size

323

Log in or register to post comments