Dados dos fragmentos de texto, la Similitud Semántica Textual captura la noción de que algunos textos son más similares que otros, midiendo su grado de equivalencia semántica. La tarea consiste en medir el grado de equivalencia semántica entre dos fragmentos de texto. Para esta tarea en español se usan dos conjuntos de datos diversos sobre varios géneros, a saber, descripciones enciclopédicas extraídas de Wikipedia en español y noticias españolas contemporáneas. Para el entrenamiento se proporcionan 65 pares de frases etiquetados. Los valores de similitud van de 0 a 4.
Mejores resultados para la tarea
| Sistema | Pearson correlation Ordenar ascendente |
|---|---|
| UMCC-DLSI-run2 | 0.8070 |
| Meerkat-Mafia-run2 | 0.8040 |
| UNAL-NLP-run1 | 0.8010 |
| UMCC-DLSI-run1 | 0.7910 |
| Meerkat-Mafia-run3 | 0.7880 |

