DA-VINCIS 2023

El corpus DA-VINCIS 2023 es una actualización del conjunto de datos utilizado en la edición anterior. Está compuesto por datos de Twitter asociados a reportes de incidentes violentos en español mexicano. Todos los tweets de este corpus tienen al menos una imagen asociada. Es el lapso de tiempo transcurrido entre la ocurrencia del hecho y su publicación en las redes sociales, en este caso se definió como tiempo máximo para considerar un tuit como reporte de este tipo de hechos un lapso de 24 horas. Se consideran las siguientes categorías de incidentes violentos: accidente, asesinato, robo y otros.

Idioma(s)
Español (Mexico)
Año
2023
Dominio
Social
Tipo Textos
Tuits
Anotaciones
violent events and their type
Acceso a datos
Publico

Publicación
Horacio Jarquín-Vásquez, Delia Irazú Hernández-Farías, Luis Joaquín Arellano, Hugo Jair Escalante, Luis Villaseñor-Pineda, Manuel Montes-y-Gómez, Fernando Sanchez-Vega (2023) Overview of DA-VINCIS at IberLEF 2023: Detection of Aggressive and Violent Incidents from Social Media in Spanish. Procesamiento del Lenguaje Natural, Revista nº 71, septiembre de 2023, pp. 351-360.
Número de unidades
4731
Tipo de unidades
Tuits
Tamaño set entrenamiento
2996
Tamaño set evaluación
1153
Tamaño set desarrollo
582
Información adicional tamaño

violent events and their type

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.