Dado un texto (secuencia de tokens), etiqueta cada token de la secuencia con una de las siguientes categorías: es un token guaraní, es un token español, es parte de una entidad nombrada (ya sea en guaraní o en español), el token es una mezcla entre guaraní y español, tokens que están en idiomas distintos al guaraní o español, otros tipos de tokens.
Publicación
Luis Chiruzzo, Marvin Agüero-Torales, Gustavo Giménez-Lugo, Aldo Alvarez, Yliana Rodríguez, Santiago Góngora, Thamar Solorio, Roberto Zanoli, Goutham Karunakaran (2023) Overview of GUA-SPA at IberLEF 2023: Guarani-Spanish Code Switching Analysis. Procesamiento del Lenguaje Natural, Revista nº 71, septiembre de 2023, pp. 321-328
Competición
Idioma
Español
NLP topic
Tarea abstracta
Dataset
Año
2023
Enlace publicación