《计算机应用研究》|Application Research of Computers

台风最大风速预测的高斯过程回归模型

Gaussian process regression model for prediction of maximum wind speed of typhoon

免费全文下载 (已被下载 次)  
获取PDF全文
作者 王鑫,李红丽
机构 江南大学 轻工过程先进控制教育部重点实验室,江苏 无锡 214122
统计 摘要被查看 次,已被下载
文章编号 1001-3695(2015)01-0059-04
DOI 10.3969/j.issn.1001-3695.2015.01.014
摘要 针对影响台风最大风速的输入变量较多以及输入变量与输出变量之间的非线性变化特点,首先计算各个输入变量与输出变量间的互信息,这些互信息间接地反映了各个输入变量与输出变量间的相关性;然后根据t检验法确定一个阈值,对于互信息小于阈值的输入变量作不相关变量处理,筛选出最佳的模型输入变量;最后采用高斯过程回归模型对筛选后的样本集进行拟合,在贝叶斯非参数建模的框架下,确定高斯过程回归模型的协方差函数。仿真结果表明,所得高斯过程模型能够满足绝对误差的预定要求,且具有较大的实用价值。
关键词 高斯过程;回归分析;贝叶斯非参数模型;特征选择;互信息
基金项目 国家自然科学基金资助项目(61273070)
江苏省自然科学基金资助项目(BK2011003)
高等学校学科创新引智计划资助项目(B12018)
江苏高校优势学科建设工程资助项目
江南大学自主科研计划青年基金资助项目(JUSRP11132)
本文URL http://www.arocmag.com/article/01-2015-01-014.html
英文标题 Gaussian process regression model for prediction of maximum wind speed of typhoon
作者英文名 WANG Xin, LI Hong-li
机构英文名 Key Laboratory of Advanced Process Control for Light Industry of Ministry of Education, Jiangnan University, Wuxi Jiangsu 214122, China
英文摘要 In the prediction model for the maximum wind speed of typhoon, the number of the input variables is very large and the output variable is a nonlinear function of the input variables. Firstly, this paper calculated the mutual information between each input variable and the output variable, because the mutual information indirectly reflected the correlation between the input and output variables. Determining a threshold on the mutual information with a t-test, it discarded the input variables whose mutual information with the output variable is less than the threshold.After it selected the optimal model input variables, a Gaussian process regression model was fitted to the selected sample set. At the same time it determined the hyper-parameters in the covariance function under the Bayesian nonparametric framework. The simulation result shows that the Gaussian process regression model has met the predetermined requirements on absolute error, and it has great practical values.
英文关键词 Gaussian process; regression analysis; Bayesian nonparametric model; feature selection; mutual information
参考文献 查看稿件参考文献
  [1] 陈联寿, 丁一汇. 西太平洋台风概论[M] . 北京:科学出版社, 1979.
[2] 龙健颜, 卢素, 刘金山. 贝叶斯非参数回归模型及非参数似不相关回归模型的应用[J] . 统计与决策, 2011, 27(16):17-20.
[3] KOTTAS A, BEHSETA S, MOORMAN D E, et al. Bayesian nonparametric analysis of neuronal intensity rates[J] . Journal of Neuroscience Methods, 2012, 203(1):241-253.
[4] 王诗文. 国家气象中心台风数值模式的改进及其应用试验[J] . 应用气象学报, 1999, 10(3):347-353.
[5] 金龙, 吴建生, 林开平, 等. 基于遗传算法的神经网络短期气候预测模型[J] . 高原气候, 2005, 24(6):981-987.
[6] 王鑫, 杨慧中. 基于LS-SVM的热带气旋强度预报[J] . 江南大学学报:自然科学版, 2010, 9(4):400-403.
[7] 史旭明, 金龙, 黄小燕. 基于KPCA的台风强度神经网络集合预报方法研究[J] . 气象科学, 2013, 33(2):184-189.
[8] Van DIJCK G, Van HULLE M M. Speeding up the wrapper feature subset selection in regression by mutual information relevance and redundancy analysis[C] //Lecture Notes in Computer Science, vol4131. Berlin:Spring-Verlag, 2006:31- 40.
[9] MUTTIL N, CHAU K W. Machine-learning paradigms for selecting ecologically significant input variables[J] . Engineering Applications of Artificial Intelligence, 2007, 20(6):735-744.
[10] 蒋盛益, 王连喜. 基于特征相关性的特征选择[J] . 计算机工程与应用, 2010, 46(20):151-156.
[11] 何志昆, 刘光斌, 赵曦晶, 等. 高斯过程回归方法综述[J] . 控制与决策, 2013, 28(8):1121-1139.
[12] 奚宏生. 随机过程引论[M] . 合肥:中国科学技术大学出版社, 2009.
[13] PARK C, HUANG J Z, DING Yu. Domain decomposition approach for fast Gaussian process regression of large spatial data sets[J] . The Journal of Machine Learning Research, 2011, 12:1697-1728.
[14] RASMUSSEN C E, WILLIAMS C K I. Gaussian processes for machine learning[M] . Cambridge:The MIT Press, 2006.
[15] 杨慧中, 章军, 陶洪峰. 基于互信息的软测量变量选择[J] . 控制工程, 2012, 19(4):562-565.
收稿日期 2013/12/3
修回日期 2014/2/20
页码 59-62
中图分类号 TP181
文献标志码 A