DETEST-Dis

El DETESTS dataset está diseñado para la detección de estereotipos en textos, específicamente enfocados en el racismo y los prejuicios en redes sociales y comentarios en artículos de noticias. Contiene textos en español, incluyendo tuits relacionados con bulos sobre inmigración y comentarios de noticias, que han sido anotados manualmente para identificar la presencia de estereotipos explícitos e implícitos. El conjunto de datos está estructurado para abordar tareas de clasificación binaria, donde los textos deben ser clasificados según si contienen estereotipos o no, así como para detectar si estos estereotipos son explícitos o implícitos.

Idioma(s)
Español
Año
2024
Dominio
Social
Anotaciones
Cada instancia tiene asignada dos etiquetas, dependiendo de si contiene estereotipos o no y si los estereotipos son implícitos o explícitos.
Formato
csv
Acceso a datos
Formulario de registro

Publicación
Schmeisser-Nieto et al. (2024). Overview of DETESTS-Dis at IberLEF 2024: DETEction and classification of racial STereotypes in Spanish - Learning with Disagreement. Procesamiento del Lenguaje Natural, Revista, 73: 323-333.
NLP Topic
Número de unidades
12111
Tipo de unidades
Tuits
Tamaño set entrenamiento
9931
Tamaño set evaluación
2180

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.