Linear Regression Fitting Based on Wave Packet Analysis
LIU Yunfei1, YANG Zhuyuan1, LEI Jing1,2
(1.School of Mathematics and Computer Science, Yunnan University of Nationalities, Kunming 650500, China; 2. Key Laboratory in Software Engineering of Yunnan Province, Kunming 650091, China)
Abstract: As the data in the model of linear regression analysis is easily susceptible to noise, this paper studies the linear regression fitting by using wave packet analysis for pre-treating the data. First, the indexes are de-noised through wave packet analysis. Then, the processed data are fitted for applying linear regression. Finally, the data of civilian vehicle inventory and GDP of 1990—2010 are studied, whose results show that the fitting method with pretreatment of the wave packet analysis can effectively improve the fitting accuracy.
Key words: wave packet analysis;linear regression;civilian vehicle inventory;GDP
在对数据直接进行回归分析时,模型容易受到噪声的影响,为了降低噪声的影响,需要对采集或接收到的数据进行去噪处理.近几年来,小波分析理论及方法的研究为众多工程领域提供了一种全新的工具和方法[1-5],它作为一种新的多分辨分析方法,可同时进行时域和频域分析,具有时频局部化和多分辨及分析特性,所以适合于信号处理中的应用,但小波方法只是对信号的低频部分进行分解,没有对高频部分进行剖分.小波包分析是小波分析的进一步发展,它能对信号的低频部分和高频部分同时进行分解,是一种更精细的分解方法,因而近几年得到了较为广泛的应用[6-8].本文在研究小波包分析方法的基础上进一步采用中国汽车保有量和国内生产总值的数据进行验证,并取得了较好的实验结果.
1 小波包分析降噪原理
一般地,一个含有噪声的信号模型可表示为
相对于小波变换,小波包变换能够对信号中的高频部分进行分解,具有更强的适应性,因此更加适合于信号的各种处理.小波包分析属于线性时频分析法,它具有良好的时频定位特性以及对信号的自适应能力,因而能够对各种时变信号进行有效的分解.
2 实例——民用汽车保有量与GDP的曲线拟合
民用汽车作为衡量人民生活水平的指标之一,对它的研究有重要意义[9-10].首先,对于民用汽车保有量的研究有利于我们对国家宏观经济走势的判断;其次,汽车工业产业是现代工业发展的一个主要推动力,其产业关联度很高,可以带动很多其他产业部门的发展,如钢铁、橡胶、玻璃、电子和化工工业;同时,随着汽车保有量的增加,其社会成本也日益增大,如交通堵塞、空气污染和能源浪费等已成为社会可持续发展的头等问题.因此,研究我国民用汽车的发展趋势,对于国家和地区的经济发展战略进行规划以及政府合理安排交通基础设施建设以及做好空气污染治理和能源规划等工作有着重要意义.
表1中选取《中国统计年鉴》中1990年至2010年中国民用汽车保有量的数据.首先用小波包分析法进行预处理,然后用线性回归方法进行拟合,以此对该方法的有效性进行进一步验证.
在Matlab中,把国内生产总值和民用汽车保有量的数值作为信号,用小波包降噪函数wpdencmp()进行降噪:xwpd=wpdencmp(x,sorh,N,‘wname’,crit,thr,keepapp),本例中各参数如下,sorh(软阈值或硬阈值选择参数)=s(软阈值),使用db4小波进行3层分解,crit(熵品)=‘shannon’,thr(阈值)=sqrtwolog,keepapp=1,(即低频系数也进行阈值处理),去噪处理后的数据如表2所示.
然后,对原始数据和小波包阈值处理后的数据分别输入Spss软件中进行线性拟合,具体步骤:打开Spss统计分析软件,在菜单栏中点击analyze(分析)—regression(回归)— linear(线性),把国内生产总值输入independent (自变量),把民用汽车保用量输到dependent(因变量)中,进行线性回归拟合,得到的结果如表3、4所示.
比较表3、4,可以看出,虽然进行过预处理和未经预处理再用线性回归拟合能得到较好的结果,但经过预处理后的复相关系数和调整后复相关系数都要高于未处理前的情况,复相关系数和调整后复相关系数反映的是样本数据与预测数据之间的相关程度,其数值越大表明拟合程度越好,因而实验结果说明对数据进行小波包分析预处理能够较好地提高拟合精度.
3 结论
本文运用小波包分析方法预处理和线性回归拟合的方法对线性回归分析模型进行去噪,最后采用1990—2010年度的民用汽车保有量和国内生产总值(GDP)的数据对该方法进行验证.通过Matlab软件用小波包分析对各个指标进行去噪处理,对处理后的数据用Spss软件线性回归拟合.实验结果证明运用小波包分析方法能有效地去除数据中的噪声,提高数据有效性和精度,具有广泛的应用价值.
参考文献:
[1]王正欢,刘琦,罗朝辉,等.基于小波分析的全国社会消费品零售总额时间序列预测[J].云南民族大学学报:自然科学版,2011,20(3):185-189.
[2]姜彬,杨柱元.基于小波神经网络的经济增长预测[J].云南民族大学学报:自然科学版,2009,18(1):81-84.
[3]潘泉,孟晋丽,张磊,等.小波滤波方法及应用[J].电子与信息学报,2007,29(1):236-242.
[4]LI Jun. Multiresolution wavelet analysis based volatility character of high frequency signal[C]//Proceedings of the Second Conference on Fuzzy Information & Engineering.Fuzzy information and engineering,2006:111-117.
[5]李媛媛,刘映杰, 李春苗.小波阈值法在炮口振动信号消噪中的应用[J].微计算机信息,2009,25(16): 233-235.
[6]王云松,林德杰.基于小波包分析的图像去噪处理 [J].计算技术与自动化, 2005,24(4):99-101.
[7]曲国庆,党亚民,章传银,等.小波包消噪方法分析及改进[J].大地测量与地球动力学,2008,28(4):102-110. (责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)