Homo-MEX | Portal ODESIA

El conjunto de datos HOMOMEX está diseñado para la detección y clasificación de discurso de odio LGBT+fóbico en español de México Se estructura en tres niveles de análisis: detección de LGBT+fobia, en tuits y frases; identificación de tipos de fobia, y detección en letras de canciones quecontienen discurso de odio.

Idioma(s)

Español (Mexico)

Enlace descripción Dataset

https://www.codabench.org/competitions/2229/

Año

2024

Anotaciones

Cada instancia tiene asignada una etiqueta, dependiendo de la tarea en la que se utiliza, que indica si es LGBT+phobic o no; o el tipo de fobia al que hace referencia, en su caso.

Formato

csv

Acceso a datos

Formulario de registro

Enlace acceso a datos

https://www.codabench.org/competitions/2229/

Publicación

Gómez-Adorno et al. (2024). Overview of HOMO-MEX at IberLEF 2024: Hate Speech Detection Towards the Mexican Spanish speaking LGBT+ Population. Procesamiento del Lenguaje Natural, Revista, 73: 393-405.

Enlace publicación

http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/download/6626/4018

NLP Topic

detección de odio

Número de unidades

18200

Tipo de unidades

Tuits

Tamaño set entrenamiento

14560

Tamaño set evaluación

3640

Inicie sesión o registrese para enviar comentarios