All Title Author
Keywords Abstract

Produ??o  2013 

Sele o de variáveis para classifica o de bateladas produtivas com base em múltiplos critérios A multiple criteria-based method for variable selection in industrial applications

Keywords: Sele o de variáveis , Múltiplos critérios , Regress o PLS , Variable selection , Multiple criteria , PLS regression

Full-Text   Cite this paper   Add to My Lib

Abstract:

Processos industriais s o frequentemente descritos por um elevado número de variáveis correlacionadas e ruidosas. Este artigo apresenta um método para sele o das variáveis mais relevantes para classifica o de bateladas de produ o valendo-se de múltiplos critérios de desempenho (sensibilidade e especificidade). As bateladas s o categorizadas em duas classes (conforme ou n o conforme, por exemplo). O método utiliza a regress o PLS (Partial Least Squares) para derivar um índice de importancia das variáveis de processo. Um procedimento iterativo de classifica o das bateladas e elimina o das variáveis é ent o conduzido. Por fim, uma medida de distancia euclidiana ponderada é aplicada para selecionar o melhor subconjunto de variáveis. Ao ser aplicado em dados de processos industriais, o método proposto reteve, em média, 12% das variáveis originais, elevando a sensibilidade em 9%, de 0,78 para 0,85, e a especificidade em 20%, de 0,64 para 0,77. Estudos de simula o permitiram avaliar o desempenho do método frente a cenários distintos. Several correlated and noisy variable are collected from industrial processes. This paper proposes a method for selecting the most relevant process variables aimed at classifying production batches into classes based on multiple criteria (e.g., sensibility and specificity). Production batches are inserted into two classes. The method first applies the PLS regression (Partial Least Squares) on process data and derives a variable importance index. A classification/elimination procedure is then carried out, and a weighted Euclidian distance is generated to identify the recommended variable subset. When applied to the testing set of real industrial data, the proposed method retained average 12% of original variables. The recommended subsets yielded 9% higher sensibility, from 0.78 to 0.85, and 20% higher specificity, from 0.64 to 0.77. Simulation experiments are also performed.

Full-Text

comments powered by Disqus