Dada una colección de documentos de informes clínicos en texto sin formato, los sistemas participantes deben proporcionar todas las menciones de especies junto con sus correspondientes identificadores de conceptos de la taxonomía del NCBI.
La Taxonomía del Centro Nacional de Biotecnología de la Información (NCBI, por sus siglas en inglés) incluye nombres de organismos clasificados principalmente en función de una jerarquía filogenética. La Taxonomía del NCBI es una base de datos universal utilizada por la Colaboración Internacional de Bases de Datos de Secuencias Nucleotídicas (INSDC), que incluye GenBank, el Laboratorio Europeo de Biología Molecular (EMBL) y el Banco de Datos de ADN de Japón (DDBJ), como fuente única de clasificación taxonómica para mantener la consistencia entre las bases de datos. En el NCBI, cada código único identifica un tipo específico de organismo (por ejemplo, ID de Taxonomía: 5476 para Candida Albicans) o grupos de organismos (ID de Taxonomía: 40674 para mamíferos).
Mejores resultados para la tarea
Sistema | MicroPrecision | MicroRecall | MicroF1 Ordenar ascendente |
---|---|---|---|
Vicomtech NLP | 0.9376 | 0.9234 | 0.9304 |
Clac | 0.9495 | 0.8910 | 0.9193 |
plncmm | 0.9139 | 0.9060 | 0.9099 |
IGES | 0.8979 | 0.8512 | 0.8740 |
Pumas | 0.9389 | 0.8075 | 0.8682 |