Dados dos fragmentos de texto, la Similitud Textual Semántica captura la noción de que algunos textos son más similares que otros, midiendo su grado de equivalencia semántica. La tarea consiste en medir el grado de equivalencia semántica entre dos fragmentos de texto. Para la tarea en español se proporcionan dos conjuntos de datos de distintos géneros, a saber, descripciones enciclopédicas extraídas de Wikipedia en español y noticias españolas contemporáneas. El conjunto de entrenamiento consiste en una cantidad limitada de datos etiquetados, 65 pares de frases. Las puntuaciones de similitud se abarcan un rango de 0 a 4.
Mejores resultados para la tarea
| Sistema | Pearson correlation Ordenar ascendente |
|---|---|
| ExBThemis-trainEs | 0.6900 |
| ExBThemis-trainMini | 0.6890 |
| ExBThemis-trainEn | 0.6720 |
| UMDuluth-BlueTeam-run1 | 0.6340 |
| SopaLipnIimas-RF | 0.5650 |

