HOMO-LAT-2025 | Portal ODESIA

El dataset HOMO-LAT25 está compuesto por publicaciones y comentarios de Reddit en español provenientes de varios países de América Latina, incluyendo Argentina, Chile, Colombia y México, así como otros países para evaluación cruzada. Todos los textos contienen al menos una palabra clave relacionada con la comunidad LGBTQ+ y están etiquetados con polaridad positiva, negativa o neutral.

Idioma(s)

Español (Argentina)

Español (Bolivia)

Español (Chile)

Español (Colombia)

Español (Dominican Republic)

Español (Mexico)

Español (Peru)

Español (Uruguay)

Enlace descripción Dataset

https://www.codabench.org/competitions/5613/

Año

2025

Dominio

Social

Anotaciones

polarity label

Formato

csv

Acceso a datos

Registro

Enlace acceso a datos

https://www.codabench.org/competitions/5613/

Publicación

Bel-Enguix, G. et al. 2025. Overview of HOMO-LAT at IberLEF 2025: Human-centric polarity detection in Online Messages Oriented to the Latin American-speaking LGBTQ+ populaTion. Procesamiento del Lenguaje Natural, 75, pp. 413-424.

Enlace publicación

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/6764

NLP Topic

detección de odio

Número de unidades

7100

Documentos

7100

Tamaño

7100.00MB

Tamaño set entrenamiento

5700

Tamaño set evaluación

1400

Inicie sesión o registrese para enviar comentarios