HOPE-ES 2023

El corpus es una colección de 2062 tweets en español anotados con una etiqueta binaria que indica si los tweets contienen un mensaje de esperanza o no. Consta de tuits relacionados con LGTB que fueron recopilados con la API de Twitter (27 de junio de 2021 al 26 de julio de 2021) y un conjunto de tuits recopilados mediante la herramienta UMUCorpusClassifier, que permite definir diferentes criterios de búsqueda como palabras clave, cuentas y geolocalización. El corpus es una versión mejorada y ampliada del conjunto de datos SpanishHopeEDI.

Idioma(s)
Español
Año
2023
Dominio
Social
Tipo Textos
Tuits
Anotaciones
binary label indicating whether a tweet contains hope speech or not
Acceso a datos
Registro

Publicación
Salud María Jiménez-Zafra, Miguel Ángel Garcia-Cumbreras, Daniel García-Baena, José Antonio Garcia-Díaz, Bharathi Raja Chakravarthi, Rafael Valencia-García, Luis Alfonso Ureña-López (2023) Overview of HOPE at IberLEF 2023: Multilingual Hope Speech Detection. Procesamiento del Lenguaje Natural, Revista nº 71, septiembre de 2023, pp. 371-381.
NLP Topic
Número de unidades
2062
Tipo de unidades
Tuits
Tamaño set entrenamiento
1312
Tamaño set evaluación
450
Tamaño set desarrollo
300

Si has publicado un resultado mejor que los del listado, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.