HOPE-ES 2023 | Portal ODESIA

El corpus es una colección de 2062 tweets en español anotados con una etiqueta binaria que indica si los tweets contienen un mensaje de esperanza o no. Consta de tuits relacionados con LGTB que fueron recopilados con la API de Twitter (27 de junio de 2021 al 26 de julio de 2021) y un conjunto de tuits recopilados mediante la herramienta UMUCorpusClassifier, que permite definir diferentes criterios de búsqueda como palabras clave, cuentas y geolocalización. El corpus es una versión mejorada y ampliada del conjunto de datos SpanishHopeEDI.

Idioma(s)

Español

Año

2023

Dominio

Social

Tipo Textos

Tuits

Anotaciones

binary label indicating whether a tweet contains hope speech or not

Acceso a datos

Registro

Enlace acceso a datos

https://codalab.lisn.upsaclay.fr/competitions/10215

Publicación

Salud María Jiménez-Zafra, Miguel Ángel Garcia-Cumbreras, Daniel García-Baena, José Antonio Garcia-Díaz, Bharathi Raja Chakravarthi, Rafael Valencia-García, Luis Alfonso Ureña-López (2023) Overview of HOPE at IberLEF 2023: Multilingual Hope Speech Detection. Procesamiento del Lenguaje Natural, Revista nº 71, septiembre de 2023, pp. 371-381.

Enlace publicación

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6567/3967

NLP Topic

detección de odio

Número de unidades

2062

Tipo de unidades

Tuits

Tamaño set entrenamiento

1312

Tamaño set evaluación

450

Tamaño set desarrollo

300

Inicie sesión o registrese para enviar comentarios