El conjunto de datos HOMOMEX está diseñado para la detección y clasificación de discurso de odio LGBT+fóbico en español de México Se estructura en tres niveles de análisis: detección de LGBT+fobia, en tuits y frases; identificación de tipos de fobia, y detección en letras de canciones quecontienen discurso de odio.
Idioma(s)
Español (Mexico)
Enlace descripción Dataset
Año
2024
Anotaciones
Cada instancia tiene asignada una etiqueta, dependiendo de la tarea en la que se utiliza, que indica si es LGBT+phobic o no; o el tipo de fobia al que hace referencia, en su caso.
Formato
csv
Acceso a datos
Formulario de registro
Enlace acceso a datos
Publicación
Gómez-Adorno et al. (2024). Overview of HOMO-MEX at IberLEF 2024: Hate Speech Detection Towards the Mexican Spanish speaking LGBT+ Population. Procesamiento del Lenguaje Natural, Revista, 73: 393-405.
NLP Topic
Número de unidades
18200
Tipo de unidades
Tuits
Tamaño set entrenamiento
14560
Tamaño set evaluación
3640
- Inicie sesión o registrese para enviar comentarios