|
Taxonomía de errores en las bases de datos cubanasKeywords: taxonomías , taxonomías de errores , detección de errores , definición de errores , limpieza de errores , análisis de bases de datos Abstract: La limpieza de datos, proceso que se caracteriza por detectar y corregir los errores en los datos, es muy usado en los ambientes donde la información se integra desde diferentes fuentes, aunque también se aplica en ficheros o bases de datos operacionales. La primera tarea dentro del proceso de limpieza de datos es la detección de los errores, y por tanto debe conocerse a qué se denomina error. Una dirección importante de trabajo en la limpieza de datos es el establecimiento de qué constituye una anomalía o error en los datos; en general esto depende del contexto que se esté analizando y de las reglas del negocio específicas para el universo de trabajo en cuestión. En este artículo se presenta el análisis realizado sobre varias bases de datos y se propone una taxonomía de errores en las bases de datos en Cuba, lo cual permitirá el desarrollo de herramientas dirigidas a limpiar estos tipos de anomalías en los datos.
|