CT–CWT–23-ES

El conjunto de datos se centra en tres temas: COVID-19, cambio climático y tecnología. El conjunto de datos en español es una combinación de CT-CWT-21, CT-CWT-22 y contenido recién recopilado. Se compone de tweets recogidos de cuentas de Twitter y transcripciones de políticos españoles, que son anotados manualmente por periodistas profesionales expertos en fact-checking. Cada tweet ha sido etiquetado usando tanto la imagen como el texto.

Idioma(s)
Español
Año
2023
Dominio
Noticias
Tipo Textos
Tuits
Anotaciones
binary label indicating whether the message is worth fact-checking
Acceso a datos
Registro

Publicación
Barrón-Cedeño, A. et al. (2023). Overview of the CLEF–2023 CheckThat! Lab on Checkworthiness, Subjectivity, Political Bias, Factuality, and Authority of News Articles and Their Source. In: Arampatzis, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2023. Lecture Notes in Computer Science, vol 14163. Springer, Cham. https://doi.org/10.1007/978-3-031-42448-9_20
Número de unidades
29984
Tamaño set entrenamiento
17487
Tamaño set evaluación
5000
Tamaño set desarrollo
7497

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.