All Title Author
Keywords Abstract

Produ??o  2013 

Um novo método para sele o de variáveis preditivas com base em índices de importancia A new framework for predictive variable selection based on variable importance indices

Keywords: Sele o de variáveis , Regress o PLS , Indicador de importancia das variáveis , Variable selection , PLS regression , Variable importance índices

Full-Text   Cite this paper   Add to My Lib

Abstract:

O grande volume de variáveis coletadas em processos industriais imp e dificuldades ao controle e monitoramento de tais processos. A regress o PLS (partial least squares) vem sendo amplamente utilizada em procedimentos de sele o de variáveis por sua capacidade de operar com grande número de variáveis correlacionadas e afetadas por ruído. Este artigo prop e um método para identificar o melhor subconjunto de variáveis de processo para a predi o das variáveis de resposta. Indicadores de importancia das variáveis s o desenvolvidos a partir de parametros da regress o PLS e guiam a elimina o das variáveis irrelevantes. Tais índices s o ent o testados em termos de seu desempenho. Ao ser aplicado em cinco bancos de dados industriais, o método utilizando o índice recomendado reteve apenas 31% das variáveis originais e aumentou a acurácia de predi o do conjunto de teste em 6%. O método proposto também superou a acurácia do método Stepwise, tradicionalmente utilizado em procedimentos de sele o com propósitos de predi o. The large volume of process variables collected from manufacturing applications has jeopardized process control activities. The Partial Least Squares (PLS) regression has been widely used for variable selection due to its ability to handle a large number of correlated and noisy variables. This paper presents a method for selecting the most relevant variables aimed at predicting product variables. For that matter, variable importance indices are developed based on PLS parameters and used to guide the elimination of noisy and irrelevant variables. Variables are then systematically removed from the dataset and the performance of the predictive model evaluated. When applied to five manufacturing datasets, the proposed method retained 31% of the original variables and yielded 6% more accurate predictions than using all original variables. Further, the proposed method outperformed the traditional Stepwise method regarding prediction accuracy.

Full-Text

comments powered by Disqus