La tarea consiste en predecir el grado de expresión de intimidad en tuits en una escala de 1 (nada íntimo) hasta 5 (muy íntimo) en diferentes idiomas. Los tuits están anotados en 10 idiomas. Los datos de entrenamiento contienen intimidad etiquetada para seis idiomas: inglés, francés, español, italiano, ortugués y chino. Para fomentar nuevos estudios sobre la comprensión de la intimidad, se incluyen otros cuatro idiomas sin datos de entrenamiento (holandés, hindi, coreano y árabe).
Publicación
Jiaxin Pei, Vítor Silva, Maarten Bos, Yozen Liu, Leonardo Neves, David Jurgens, and Francesco Barbieri. 2023. SemEval-2023 Task 9: Multilingual Tweet Intimacy Analysis. In Proceedings of the 17th International Workshop on Semantic Evaluation (SemEval-2023), pages 2235–2246, Toronto, Canada. Association for Computational Linguistics.
Idioma
Español
Inglés
NLP topic
Tarea abstracta
Dataset
Año
2023
Enlace publicación
Métrica Ranking
Pearson correlation