detección de odio

JOKER 2023 ES

El conjunto de datos es una colección de tweets en español donde se anotan las palabras que expresan juegos de palabras. Un juego de palabras es una forma de juego de palabras en el que una palabra o frase evoca el significado de otra palabra o frase con una pronunciación similar o idéntica.

HOPE-ES 2023

El corpus es una colección de 2062 tweets en español anotados con una etiqueta binaria que indica si los tweets contienen un mensaje de esperanza o no. Consta de tuits relacionados con LGTB que fueron recopilados con la API de Twitter (27 de junio de 2021 al 26 de julio de 2021) y un conjunto de tuits recopilados mediante la herramienta UMUCorpusClassifier, que permite definir diferentes criterios de búsqueda como palabras clave, cuentas y geolocalización. El corpus es una versión mejorada y ampliada del conjunto de datos SpanishHopeEDI.