SemEval-2023 Task 9: Multilingual Tweet Intimacy Analysis

Multilingual Tweet Intimacy Analysis es una tarea que consiste en predecir la expresión de intimidad en tuits en distintos idiomas. Reconocer la intimidad puede servir como punto de referencia para poner a prueba la capacidad de los modelos computacionales para comprender información social.  Para promover el modelado computacional de la intimidad textual, se organizó un concurso en torno al conjunto de datos Multilingual textual intimacy (MINT). Los datos de entrenamiento de MINT abarcan tuits en 6 idiomas: inglés, español, francés, portugués, italiano y chino, que son lenguas usadas por más de tres billones de personas en el mundo,  en América, Europa y Asia. En total, se anotan 12.000 tuits en los seis idiomas. Para comprobar la generalizabilidad del modelo en la configuración de zero-shot, se proporcionan pequeños conjuntos de prueba para el neerlandés, el coreano, el hindi y el árabe (500 tuits para cada uno).