GUA-SPA: Language identification in code-switched data

Dado un texto (secuencia de tokens), etiqueta cada token de la secuencia con una de las siguientes categorías: es un token guaraní, es un token español, es parte de una entidad nombrada (ya sea en guaraní o en español), el token es una mezcla entre guaraní y español, tokens que están en idiomas distintos al guaraní o español, otros tipos de tokens.

Publicación
Luis Chiruzzo, Marvin Agüero-Torales, Gustavo Giménez-Lugo, Aldo Alvarez, Yliana Rodríguez, Santiago Góngora, Thamar Solorio, Roberto Zanoli, Goutham Karunakaran (2023) Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching Analysis. Procesamiento del Lenguaje Natural, Revista nº 71, septiembre de 2023, pp. 321-328

Mejores resultados para la tarea

Sistema weighted f1
pughrob 0.94
tsjauhia 0.91
amunozo 0.85

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.