DIANN-2018-EN

El corpus es una colección de 500 resúmenes de artículos biomédicos de Elsevier descargados durante  2017 y 2018. Está dividido en una partición de entrenamiento (80%) y una de evaluación (20%). Está anotado con discapacidades, negaciones y el alcance de las negaciones.

Idioma(s)
Inglés
Año
2018
Dominio
Salud
Tipo Textos
Resúmenes de artículos científicos
Anotaciones
discapacidades, negaciones y alcance de negaciones
Formato
xml
Acceso a datos
Publico

Publicación
Hermenegildo Fabregat, Juan Martínez-Romo, Lourdes Araujo (2018) Overview of the DIANN Task: Disability Annotation Task. Proceedings of the Third Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2018).
Licencia
CC-BY-4.0
Número de unidades
500
Tipo de unidades
Documentos
Tokens
89325
Frases
6091
Documentos
500
Tamaño set entrenamiento
400 abstracts
Tamaño set evaluación
100 abstracts

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.