Datasets
A continuación se muestra información sobre conjuntos de datos textuales en español creados con el objetivo de resolver tareas de PLN. En este caso, se trata de colecciones de textos, generalmente enriquecidas con anotaciones.
-
CardioCCC-2024
SaludPublicado en 2024508Informes de casos clínicosreconocimiento de entidades nombradas -
EXIST-2024-ES
SocialEspañolPublicado en 20249,653detección de odio -
DrugTEMIST -2024
SaludEspañol , Inglés , ItalianoPublicado en 20241,000Informes de casos clínicosreconocimiento de entidades nombradas -
IberAuTexTification
Noticias, Social, otrosEspañol , Inglés , PortuguésPublicado en 2024168,128generación de texto -
FLARES
NoticiasEspañolPublicado en 2024190extracción de información -
RefutES
SocialEspañolPublicado en 20242,931generación de texto -
MentalRiskES Detection
SaludEspañolPublicado en 202479,975elaboración de perfiles -
DIMEMEX
SocialEspañol (Mexico)Publicado en 20242,586detección de odio -
MentalRiskES Suicide
SaludEspañolPublicado en 20243,072elaboración de perfiles -
DETEST-Dis
SocialEspañolPublicado en 202412,111detección de odio -
JOKER 2023 ES
SocialEspañol , InglésPublicado en 20234,235Tuitsprocesamiento de humor -
EXIST-2023-ES
SocialEspañol , InglésPublicado en 20234,653Tuitsdetección de odio -
CT–CWT–23-ES
NoticiasEspañolPublicado en 202329,984Tuitsdetección de noticias falsas -
MedProcNER/ProcTEMIST corpus 2023
SaludEspañolPublicado en 20231,000Informes clínicosreconocimiento de entidades nombradas -
Rest-Mex 2023 Clustering
NoticiasEspañol , Español (Mexico)Publicado en 2023114,550Noticiasmodelado de temas
Paginación
Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.