extracción de información

FLARES

El dataset consiste en un conjunto de noticias etiquetadas con los segmentos de texto en los que se responde a las 5 Ws (¿quién?, ¿qué?, ¿cuándo?, ¿dónde?, ¿por qué?) y con su fiabilidad o credibilidad (fiable, parcialmente fiable, no fiable).

DIANN-2018-ES

El corpus es una colección de 500 resúmenes de artículos biomédicos de Elsevier descargados durante  2017 y 2018. Está dividido en una partición de entrenamiento (80%) y una de evaluación (20%). Está anotado con discapacidades, negaciones y el alcance de las negaciones.