|
Produ??o 2013
Sele o de variáveis para classifica o de bateladas produtivas com base em múltiplos critérios A multiple criteria-based method for variable selection in industrial applicationsKeywords: Sele o de variáveis , Múltiplos critérios , Regress o PLS , Variable selection , Multiple criteria , PLS regression Abstract: Processos industriais s o frequentemente descritos por um elevado número de variáveis correlacionadas e ruidosas. Este artigo apresenta um método para sele o das variáveis mais relevantes para classifica o de bateladas de produ o valendo-se de múltiplos critérios de desempenho (sensibilidade e especificidade). As bateladas s o categorizadas em duas classes (conforme ou n o conforme, por exemplo). O método utiliza a regress o PLS (Partial Least Squares) para derivar um índice de importancia das variáveis de processo. Um procedimento iterativo de classifica o das bateladas e elimina o das variáveis é ent o conduzido. Por fim, uma medida de distancia euclidiana ponderada é aplicada para selecionar o melhor subconjunto de variáveis. Ao ser aplicado em dados de processos industriais, o método proposto reteve, em média, 12% das variáveis originais, elevando a sensibilidade em 9%, de 0,78 para 0,85, e a especificidade em 20%, de 0,64 para 0,77. Estudos de simula o permitiram avaliar o desempenho do método frente a cenários distintos. Several correlated and noisy variable are collected from industrial processes. This paper proposes a method for selecting the most relevant process variables aimed at classifying production batches into classes based on multiple criteria (e.g., sensibility and specificity). Production batches are inserted into two classes. The method first applies the PLS regression (Partial Least Squares) on process data and derives a variable importance index. A classification/elimination procedure is then carried out, and a weighted Euclidian distance is generated to identify the recommended variable subset. When applied to the testing set of real industrial data, the proposed method retained average 12% of original variables. The recommended subsets yielded 9% higher sensibility, from 0.78 to 0.85, and 20% higher specificity, from 0.64 to 0.77. Simulation experiments are also performed.
|