%0 Journal Article %T WHEREIN ARE SHOWN SOME RESULTS OF AUTORSHIP ATTRIBUTION TO CERVANTES¡¯ WORK DONDE SE MUESTRAN ALGUNOS RESULTADOS DE ATRIBUCI¨®N DE AUTOR EN TORNO A LA OBRA CERVANTINA %A L¨®pez Freddy %J Revista Colombiana de Estad¨ªstica %D 2011 %I Universidad Nacional de Colombia %X In this paper, some classification methods are applied to a set of texts with the aim of studying the probability that the book Novela de la t¨ªa fingida has been written by Miguel de Cervantes. This novel has been historically attributed to him but there are some encountered positions about this. The methods used in this paper range from: logistic regression, additive logistic regression, linear, quadratic, regularized, mixture and flexible discriminant analysis, classification tree, k-nearest neighbour, Naive Bayes method and support vector machines. Methods were trained and applied using a corpus of authors contemporary to Cervantes as Lope de Vega, Jer¨®nimo de Pasamonte, Alonso Fern¨¢ndez de Avellaneda, Mateo Alem¨¢n, and Francisco de Quevedo and more than forty variables, mainly words and punctuation marks, measured over written texts by these authors. Respect to these methods, most of them classify the novel as another Cervantes¡¯ work; however, is our recommendation to include more texts from these authors and more authors. En este art¨ªculo se aplican algunos m¨¦todos de clasificaci¨®n a un conjunto de textos con el objetivo de estudiar la probabilidad que el libro Novela de la t¨ªa fingida haya sido escrita por Miguel de Cervantes. Esta novela se le ha atribuido hist¨®ricamente, pero existen algunas posiciones encontradas al respecto. Los m¨¦todos usados en este art¨ªculo contemplan: regresi¨®n log¨ªstica, regresi¨®n log¨ªstica aditiva, an¨¢lisis discriminante lineal, cuadr¨¢tico, regularizado, de mezclas y flexible, ¨¢rboles de clasificaci¨®n, m¨¦todo de los k-¨¦simos vecinos m¨¢s cercanos, m¨¦todo de Bayes ingenuo y m¨¢quinas de soporte vectorial. Los m¨¦todos fueron calibrados y aplicados utilizando un corpus de autores contempor¨¢neos a Cervantes (Lope de Vega, Jer¨®nimo de Pasamonte, Alonso Fern¨¢ndez de Avellaneda, Mateo Alem¨¢n y Francisco de Quevedo) junto con m¨¢s de cuarenta variables, principalmente palabras y signos de puntuaci¨®n, medidas sobre muestras de los textos escritos por estos autores. Con respecto a estos m¨¦todos, la mayor¨ªa clasifica la obra como cervantina; sin embargo, es recomendable ampliar el corpus utilizado para el estudio e incluir m¨¢s autores para la comparaci¨®n. %K Bayes rule %K Classification tree %K Cross validation %K Discriminant Analysis %K Logistic regression %K Machine learning %U http://www.revistas.unal.edu.co/index.php/estad/article/view/29882