HOMO-LAT-2025

El dataset HOMO-LAT25 está compuesto por publicaciones y comentarios de Reddit en español provenientes de varios países de América Latina, incluyendo Argentina, Chile, Colombia y México, así como otros países para evaluación cruzada. Todos los textos contienen al menos una palabra clave relacionada con la comunidad LGBTQ+ y están etiquetados con polaridad positiva, negativa o neutral.

Idioma(s)
Español (Argentina)
Español (Bolivia)
Español (Chile)
Español (Colombia)
Español (Dominican Republic)
Español (Mexico)
Español (Peru)
Español (Uruguay)
Año
2025
Dominio
Social
Anotaciones
polarity label
Formato
csv
Acceso a datos
Registro

Publicación
Bel-Enguix, G. et al. 2025. Overview of HOMO-LAT at IberLEF 2025: Human-centric polarity detection in Online Messages Oriented to the Latin American-speaking LGBTQ+ populaTion. Procesamiento del Lenguaje Natural, 75, pp. 413-424.
NLP Topic
Número de unidades
7100
Documentos
7100
Tamaño
7100.00MB
Tamaño set entrenamiento
5700
Tamaño set evaluación
1400

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.