El dataset contiene mensajes en español sobre juego extraídos de plataformas digitales como Telegram, Twitch, Reddit y Ludopatía.org. Cada usuario está etiquetado según su nivel de riesgo (alto o bajo) y tipo de adicción.
Idioma(s)
Español
Enlace descripción Dataset
Año
2025
Dominio
Salud
Anotaciones
Cada instancia del dataset está etiquetada con un nivel de riesgo (alto o bajo) y con un tipo específico de adicción (betting, online gaming, trading/crypto o lootboxes), permitiendo tanto una clasificación binaria como una clasificación multiclase.
Formato
json
Acceso a datos
Registro
Enlace acceso a datos
Publicación
Mármol-Romero, A. et al. (2025). Overview of MentalRiskES at IberLEF 2025: Early Detection of Addiction Risk in Spanish. Procesamiento del Lenguaje Natural, Revista, 75: 425-440.
Enlace publicación
NLP Topic
Número de unidades
32342
Documentos
32342
Tamaño
32342.00MB
Tamaño set entrenamiento
22,491
Tamaño set evaluación
9,407
Tamaño set desarrollo
444
- Inicie sesión o registrese para enviar comentarios

