%0 Journal Article %T Predicci¨®n de la estructura secundaria de prote¨ªnas usando M¨¢quinas de soporte Vectorial %A Delgado Dar¨ªo Jos¨¦ %A Arguello Fuentes Henry %A Torres Rodrigo Gonzalo %J Revista Colombiana de Biotecnolog¨ªa %D 2012 %I Universidad Nacional de Colombia %X T¨ªtulo en ingles: Protein secondary structure prediction using support vector machines Abstract : Among the computational methods used for predicting secondary structure proteins highlights the use of support vector machines. This research shows the predicted secondary structure of protein from its primary amino acid sequence using Support Vector Machines. As inputs, in the proposed methodology, features are used from different structural motifs or text strings associated with the primary structure which represents the secondary structure, such as R-group and the probability that the amino acid at position adopts a central particular secondary structure. For feature extraction method is used coding of sequences in which each symbol in the primary structure is associated with each symbol in the secondary structure. The use of this encoding method reduces the dimensionality of the data of thousands of characteristics only 220 of these. The results obtained are comparable to those reported in the literature, taking about 70% accuracy. Furthermore, it is possible to reduce computational cost in the construction of classifiers because this work models the problem of multi classification as a group of binary classifiers. Key words: coding methodology; support vector machines; prediction of protein secondary structure. Resumen: Entre los m¨¦todos computacionales utilizados para la predicci¨®n de la estructura secundaria de prote¨ªnas, se destaca el uso de m¨¢quinas de soporte vectorial. Este trabajo de investigaci¨®n presenta la predicci¨®n de la estructura secundaria de prote¨ªnas desde su secuencia primaria de amino¨¢cidos usando M¨¢quinas de Soporte Vectorial. Como entradas, en la metodolog¨ªa propuesta, se utilizan caracter¨ªsticas de los diferentes motivos estructurales o cadenas de texto asociadas a la estructura primaria que representa la estructura secundaria, tales como el R-grupo y la probabilidad de que el amino¨¢cido en la posici¨®n central adopte una determinada estructura secundaria. Para la extracci¨®n de caracter¨ªsticas se utiliza un m¨¦todo de codificaci¨®n de secuencias en el que cada s¨ªmbolo en la estructura primaria se relaciona con cada s¨ªmbolo en la estructura secundaria. El uso de este m¨¦todo de codificaci¨®n permite reducir la dimensionalidad de los datos de miles de caracter¨ªsticas a s¨®lo 220 de estas. Los resultados obtenidos son comparables a los registrados en la literatura, teniendo cerca de un 70% de precisi¨®n. Adem¨¢s, se logra reducir los costos computacionales en la construcci¨®n de los clasificadores debido a que este trabajo modela el probl %K coding methodology %K support vector machines %K prediction of protein secondary structure %K m¨¢quinas de soporte vectorial %K metodolog¨ªa de codificaci¨®n %K predicci¨®n de la estructura secundaria de prote¨ªnas %U http://www.revistas.unal.edu.co/index.php/biotecnologia/article/view/32885