El conjunto de datos se centra en tres temas: COVID-19, cambio climático y tecnología. El conjunto de datos en español es una combinación de CT-CWT-21, CT-CWT-22 y contenido recién recopilado. Se compone de tweets recogidos de cuentas de Twitter y transcripciones de políticos españoles, que son anotados manualmente por periodistas profesionales expertos en fact-checking. Cada tweet ha sido etiquetado usando tanto la imagen como el texto.
Idioma(s)
Español
Año
2023
Dominio
Noticias
Tipo Textos
Tuits
Anotaciones
binary label indicating whether the message is worth fact-checking
Acceso a datos
Registro
Enlace acceso a datos
Publicación
Barrón-Cedeño, A. et al. (2023). Overview of the CLEF–2023 CheckThat! Lab on Checkworthiness, Subjectivity, Political Bias, Factuality, and Authority of News Articles and Their Source. In: Arampatzis, A., et al. Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2023. Lecture Notes in Computer Science, vol 14163. Springer, Cham. https://doi.org/10.1007/978-3-031-42448-9_20
Enlace publicación
NLP Topic
Número de unidades
29984
Tamaño set entrenamiento
17487
Tamaño set evaluación
5000
Tamaño set desarrollo
7497
- Inicie sesión o registrese para enviar comentarios