El corpus es una colección de 500 resúmenes de artículos biomédicos de Elsevier descargados durante 2017 y 2018. Está dividido en una partición de entrenamiento (80%) y una de evaluación (20%). Está anotado con discapacidades, negaciones y el alcance de las negaciones.
Idioma(s)
Español
Enlace descripción Dataset
Año
2018
Dominio
Salud
Tipo Textos
Resúmenes de artículos científicos
Anotaciones
discapacidades, negaciones y alcance de negaciones
Formato
xml
Enlace guía anotaciones
Acceso a datos
Publico
Enlace acceso a datos
Publicación
Hermenegildo Fabregat, Juan Martínez-Romo, Lourdes Araujo (2018) Overview of the DIANN Task: Disability Annotation Task. Proceedings of the Third Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2018).
Enlace publicación
Licencia
CC-BY-4.0
Número de unidades
500
Tipo de unidades
Documentos
Tokens
98948
Frases
5923
Documentos
500
Tamaño set entrenamiento
400 abstracts
Tamaño set evaluación
100 abstracts
- Inicie sesión o registrese para enviar comentarios