MentalRiskES-2025

El dataset contiene mensajes en español sobre juego extraídos de plataformas digitales como Telegram, Twitch, Reddit y Ludopatía.org. Cada usuario está etiquetado según su nivel de riesgo (alto o bajo) y tipo de adicción.
Idioma(s)
Español
Año
2025
Dominio
Salud
Anotaciones
Cada instancia del dataset está etiquetada con un nivel de riesgo (alto o bajo) y con un tipo específico de adicción (betting, online gaming, trading/crypto o lootboxes), permitiendo tanto una clasificación binaria como una clasificación multiclase.
Formato
json
Acceso a datos
Registro

Publicación
Mármol-Romero, A. et al. (2025). Overview of MentalRiskES at IberLEF 2025: Early Detection of Addiction Risk in Spanish. Procesamiento del Lenguaje Natural, Revista, 75: 425-440.
Número de unidades
32342
Documentos
32342
Tamaño
32342.00MB
Tamaño set entrenamiento
22,491
Tamaño set evaluación
9,407
Tamaño set desarrollo
444

Si has publicado un resultado mejor que los de la lista, envía un mensaje a odesia-comunicacion@lsi.uned.es indicando el resultado y el DOI del artículo, junto con una copia del mismo si no está publicado en abierto.