El dataset consiste en un corpus multilingüe con más de 30.000 tweets en inglés y español, anotados en cinco categorías: Not Hope, Generalized Hope, Realistic Hope, Unrealistic Hope y Sarcasm.
Idioma(s)
Español
Inglés
Año
2025
Dominio
Social
Tipo Textos
Tuits
Anotaciones
Cada tuit en PolyHope V2 está anotado con una única etiqueta categórica que indica el tipo de esperanza expresada: No esperanza, esperanza generalizada, esperanza realista, esperanza irrealista o sarcasmo.
Formato
txt
Acceso a datos
Publico
Enlace acceso a datos
Publicación
Butt, S., et al. 2025. Optimism, expectation, or sarcasm? Multi-class hope speech detection in spanish and english. arXiv preprint arXiv:2504.17974
Enlace publicación
NLP Topic
Número de unidades
29957
Tipo de unidades
Tuits
Documentos
29957
Tamaño
29957.00MB
- Inicie sesión o registrese para enviar comentarios

