El conjunto de datos de AuTexTification consta de textos escritos por humanos y LLM en cinco dominios: tweets, reseñas, artículos instructivos, noticias y documentos legales.
Idioma(s)
Español
Inglés
Enlace descripción Dataset
Año
2023
Dominio
General
Legal
Noticias
Anotaciones
Model generated or not, attributed model.
Acceso a datos
Registro
Enlace acceso a datos
Publicación
Areg Mikael Sarvazyan, José Ángel González, Marc Franco-Salvador, Francisco Rangel, Berta Chulvi, Paolo Rosso (2023) Overview of AuTexTification at IberLEF 2023: Detection and Attribution of Machine-Generated Text in Multiple Domains. Procesamiento del Lenguaje Natural, Revista nº 71, septiembre de 2023, pp. 275-288.
Enlace publicación
NLP Topic
Número de unidades
52191
Tipo de unidades
Muestras de textos
Información adicional tamaño
model generated or not, attributed model
- Inicie sesión o registrese para enviar comentarios