|
一种基于遗传算法的回归模型寻优方法
|
Abstract:
回归分析是数据分析和建模的重要工具,主要用于数据的预测和拟合。回归分析通常需要人工干预给定参考模型,再进行参数回归。然而,在多数情况下,用户难以给出参考模型,或者给出模型具有较大的误差。本文提出一种基于遗传算法得出回归模型的方法,主要利用遗传进化的思想,首先随机产生初始模型的种群;然后不断迭代的进行选择、交叉、变异操作,在解空间中动态地进行全局寻优,找出一个较优的模型;为了确定模型的参数,又利用梯度下降法对该模型进行参数估算。最后,将本文得出的模型与最小二乘法回归分析得出的模型进行对比,结果表明,在进行预测时,前者的误差比后者有显著减小,由14.24%减少到9.59%。
Regression analysis is an important tool for data analysis and modeling, mainly used for data pre-diction and fitting. Regression analysis usually requires manual intervention of a given reference model followed by parametric regression. However, in most cases, it was difficult for the user to given a reference model or given the model a large error. It proposed a method based on genetic algorithm to obtain regression model. It mainly used the idea of genetic evolution to first randomly generated an initial model populations; then iteratively selected, crossed, and mutated operations, perform global optimization dynamically in the solution space to find a better model; in order to determine the parameters of the model, the gradient descent method is used to estimate the parameters of the model. Finally, the model obtained in this paper is compared with the model obtained by least squares regression analysis. The results show that the error of the former is sig-nificantly reduced from the previous one, from 14.24% to 9.59%.
[1] | 张钰珩. 浅析回归分析在经济金融领域的运用[J]. 商场现代化, 2018(1): 147-148. |
[2] | 王曼. 医学论文中常用回归分析方法的审核要点及对策[J]. 编辑学报, 2018, 30(5): 475-477. |
[3] | 孔德兵, 尚可政, 王式功, 等. 基于逐步回归分析的西北地区东部雷暴概率预报方法研究[J]. 干旱气象, 2016, 34(1): 181-187. |
[4] | 孙克, 徐中民. 基于地理加权回归的中国灰水足迹人文驱动因素分析[J]. 地理研究, 2016, 35(1): 37-48. |
[5] | 施龙青. 基于多元回归分析法预测断层防隔水煤柱宽度[J]. 煤炭科学技术, 2013, 41(6): 108-110. |
[6] | 卢骏, 戴吾蛟, 章浙涛. 大坝变形变系数回归建模[J]. 武汉大学学报(信息科学版), 2015, 40(1): 139-142. |
[7] | Nijhout, F. (1997) An Introduction to Genetic Algorith-MS. Complexity, 2, 39-40. https://doi.org/10.1002/(SICI)1099-0526(199705/06)2:5<39::AID-CPLX8>3.0.CO;2-L |
[8] | 蔡良伟, 李霞. 遗传算法交叉操作的改进[J]. 系统工程与电子技术, 2006, 28(6): 925-928. |
[9] | 周祥, 何小荣, 陈丙珍. 基于最优变异因子的遗传算法在ANN训练中的应用[J]. 清华大学学报(自然科学版), 2002(5): 619-621. |
[10] | 马洁莹. 基于轮盘赌策略的混沌萤火虫算法研究[D]: [硕士学位论文]. 西安: 西安电子科技大学, 2018. |
[11] | 黄文霞, 李民. 基于SPSS数据分析的影响旅游地区发展的主要因素分析[J]. 软件, 2019, 40(1): 152-157. |