Datasets
A continuación se muestra información sobre conjuntos de datos textuales en español creados con el objetivo de resolver tareas de PLN. En este caso, se trata de colecciones de textos, generalmente enriquecidas con anotaciones.
-
Spanish Fake News Corpus
DiversosEspañol (Mexico)Publicado en 2020971Noticiasdetección de noticias falsas -
Mexican Aggressiveness Corpus
Español (Mexico)Publicado en 202010,475Tuitsdetección de odio -
FACT
Español , Español (Uruguay)Publicado en 2020Noticiasprocesamiento de factualidad, procesamiento de eventos -
CAPITEL-UD
EspañolPublicado en 2020Noticiasanálisis sintáctico -
CAPITEL-NER
EspañolPublicado en 2020Noticiasreconocimiento de entidades nombradas -
HateEval-ES
EspañolPublicado en 20196,600Tuitsdetección de odio -
InterTASS-URU
EspañolPublicado en 20192,857Tuitsanálisis de sentimiento -
InterTASS-PE
EspañolPublicado en 20193,005Tuitsanálisis de sentimiento -
InterTASS-CR
EspañolPublicado en 20192,363Tuitsanálisis de sentimiento -
InterTASS-MEX
EspañolPublicado en 20193,000Tuitsanálisis de sentimiento -
InterTASS-SP
EspañolPublicado en 20193,401Tuitsanálisis de sentimiento -
MEDDOCAN
SaludEspañolPublicado en 20191,000Informes de casos clínicosreconocimiento de entidades nombradas, extracción de información -
HAHA
EspañolPublicado en 201930,000Tuitsprocesamiento de humor -
FACT
Español , Español (Uruguay)Publicado en 2019Noticiasprocesamiento de factualidad -
eHealth-KD 2019
EspañolPublicado en 20191,000Saludextracción de información
Paginación
Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.