El dataset HOMO-LAT25 está compuesto por publicaciones y comentarios de Reddit en español provenientes de varios países de América Latina, incluyendo Argentina, Chile, Colombia y México, así como otros países para evaluación cruzada. Todos los textos contienen al menos una palabra clave relacionada con la comunidad LGBTQ+ y están etiquetados con polaridad positiva, negativa o neutral.
Idioma(s)
Español (Argentina)
Español (Bolivia)
Español (Chile)
Español (Colombia)
Español (Dominican Republic)
Español (Mexico)
Español (Peru)
Español (Uruguay)
Enlace descripción Dataset
Año
2025
Dominio
Social
Anotaciones
polarity label
Formato
csv
Acceso a datos
Registro
Enlace acceso a datos
Publicación
Bel-Enguix, G. et al. 2025. Overview of HOMO-LAT at IberLEF 2025: Human-centric polarity detection in Online Messages Oriented to the Latin American-speaking LGBTQ+ populaTion. Procesamiento del Lenguaje Natural, 75, pp. 413-424.
Enlace publicación
NLP Topic
Número de unidades
7100
Documentos
7100
Tamaño
7100.00MB
Tamaño set entrenamiento
5700
Tamaño set evaluación
1400
- Inicie sesión o registrese para enviar comentarios

