Esta tarea introduce una nueva modalidad en el desafío de AER, incorporando el audio. El objetivo es integrar señales de texto y voz para determinar la emoción transmitida en cada fragmento, basándose en cinco de las seis emociones básicas de Ekman: ira, asco, miedo, alegría y tristeza, además de una emoción neutra.
Publicación
Pan et al. (2024). Overview of EmoSPeech at IberLEF 2024: Multimodal Speech-text Emotion Recognition in Spanish. Procesamiento del Lenguaje Natural, Revista, 73: 359-368.
Idioma
Español
NLP topic
Dataset
Año
2024
Enlace publicación
Métrica Ranking
Macro F1
Mejores resultados para la tarea
| Sistema | MacroF1 Ordenar ascendente |
|---|---|
| BSCUPC | 0.8669 |
| THAUUPM | 0.8248 |
| CogniCIC | 0.7123 |
| ITST | 0.6876 |
| UNEDUNIOVI | 0.6709 |

