PoliticES 2023 es una extensión del conjunto de datos PoliCorpus 2020 y del corpus utilizado para la tarea compartida PoliticES 2022. Se recopiló entre 2020 y 2022 de cuentas de las cuentas de Twitter de políticos, periodistas políticos y famosos de España mediante el UMUCorpusClassifier.
Estos usuarios fueron seleccionados porque su afiliación política se puede adivinar según el partido al que pertenecen los políticos, la línea editorial de los periódicos donde escriben los periodistas o el tipo de partido político que apoyan los famosos. Las cuentas de los políticos fueron seleccionadas entre: (1) miembros del gobierno de España, (2) miembros del Congreso y Senado de España, (3) alcaldes de algunas ciudades importantes de España, (4) presidentes de las comunidades autónomas, ( 5) ex políticos, y (6) colaboradores afiliados a partidos políticos. Se seleccionaron periodistas de diferentes medios informativos españoles, como ABC, El País, El Diario, El Mundo o La Razón entre otros. Los tweets que pertenecen a cada cluster se seleccionan favoreciendo la diversidad, incluyendo textos de diferentes fechas y temáticas. Cada grupo está etiquetado con un género autoasignado (masculino, femenino), profesión (celebridad, político, periodista) y espectro político en dos ejes: binario (izquierda, derecha) y multiclase (izquierda, izquierda moderada, derecha moderada, derecha). ). El conjunto de datos final consta de 2797 grupos de 80 tweets cada uno.
- Inicie sesión o registrese para enviar comentarios