EXIST-2023-ES

El corpus español EXIST 2023 es una colección de tuits etiquetados con información relacionada con el sexismo: si el tweet es sexista, el tipo de intención que muestra el autor del tuit y el tipo de sexismo que se está ejerciendo.

Idioma(s)
Español
Inglés
Año
2023
Dominio
Social
Tipo Textos
Tuits
Anotaciones
binary label indicating whether a tweet expresses sexism, multiclass lables about the type of sexism and the intention of the author
Formato
json
Acceso a datos
Registro

Publicación
Plaza, L. et al. (2023). Overview of EXIST 2023 – Learning with Disagreement for Sexism Identification and Characterization. In: Arampatzis, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2023. Lecture Notes in Computer Science, vol 14163. Springer, Cham. https://doi.org/10.1007/978-3-031-42448-9_23
NLP Topic
Número de unidades
4653
Tipo de unidades
Tuits
Tamaño set entrenamiento
3194
Tamaño set evaluación
969
Tamaño set desarrollo
490

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.