%0 Journal Article %T An芍lisis del proceso de miner赤a de datos sobre la base de datos Bioinform芍tica de segmentos de la prote赤na p53, asociada a la actividad cancer赤gena %A Alejandro Hadad %A Franco Simonetti %J Revista Facultad de Ingenier赤a %D 2011 %I Universidad Pedag車gica y Tecnol車gica de Colombia %X Se estudi車 la utilizaci車n de estrategias para afrontar el problema del desbalanceo y la alta dimensionalidad de los registros que habitualmente forman parte de las bases de datos en el 芍rea bioinform芍tica. Se tom車 como caso de estudio la base de datos de segmentos de la prote赤na p53; sobre dicha base se construyen modelos con el fin de identificar si corresponden a patrones activos o inactivos. El problema del desbalanceo se abord車 a trav谷s de una red neuronal no supervisada, y el de la selecci車n de variables para reducir la alta dimensionalidad, a partir de una combinaci車n de m谷todos con diferentes enfoques. Experimentos preliminares del modelo propuesto en datos est芍ndar muestran resultados promisorios. %K Imbalances %K Variables Selection %K Bioinformatics %U http://virtual.uptc.edu.co/revistas/index.php/ingenieria/article/viewFile/1267/1213