Entity recognition

En esta tarea, dada una lista de documentos de eHealth escritos en español, el objetivo es identificar todas las frases clave por documento y caracterizarlas con los conceptos (es decir, clases) que las representan. Estas frases clave son todos los términos relevantes (una sola palabra o varias palabras) que representan elementos semánticamente importantes en una oración.

Existen cuatro categorías o clases para las frases clave:

  1. Concepto: una categoría general que indica que la frase clave es un término relevante, concepto o idea en el dominio de conocimiento de la oración.

  2. Acción: un concepto que indica un proceso o modificación de otros conceptos. Puede estar indicado por un verbo o construcción verbal, como "afecta", pero también por sustantivos, como "exposición", donde denota el acto de estar expuesto al sol, y "daños", donde denota el acto de dañar la piel.

  3. Predicado: utilizado para representar una función o filtro de otro conjunto de elementos, que tiene una etiqueta semántica en el texto, como "mayores", y se aplica a un concepto, como "personas", con algunos argumentos adicionales como "60 años".

  4. Referencia: un elemento textual que se refiere a un concepto, ya sea en la misma oración o en otra diferente, y que puede estar indicado por pistas textuales como "esta", "aquel" y similares.

Publicación
Alejandro Piad-Morffis, Yoan Gutiérrez, Juan Pablo Consuegra-Ayala, Suilan Estevez-Velarde, Yudivián Almeida-Cruz, Rafael Muñoz, Andrés Montoyo (2019) Overview of the eHealth Knowledge Discovery Challenge at IberLEF 2019. Proceedings of the Iberian Languages Evaluation Forum (IberLEF 2019)
Idioma
Español
Tarea abstracta
Dataset
Año
2019
Métrica Ranking
F1

Mejores resultados para la tarea

Sistema F1
TALP-UPC 0.8200
coin_flipper 0.7870
LASTUS-TALN 0.8160
UH-Maja-KD 0.8150
HULAT-TaskA 0.7900

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.