陕西师范大学：IPv6环境下基于ARIMA-Kalman混合模型的网络负载资源预测方法―中国教育和科研计算机网CERNET

陕西师范大学：IPv6环境下基于ARIMA-Kalman混合模型的网络负载资源预测方法

　　随着云计算应用的广泛普及，云计算与互联网的结合也日益紧密，以IPv6为代表的下一代互联网将是未来云计算最优化的选择方案之一。IPv6协议是下一代互联网的核心网络协议，能够更加有效地为云平台及云应用提供网络资源保障和强有力的技术支撑。目前，云用户在享受云计算带来的极大便利的同时，也面临着一些问题，其中重要的问题之一是资源分配问题。为了能够高效地管理资源，实现资源利用率最大化，在云平台资源管理中引入预测技术[1]，根据负载情况有效的预测资源使用量，进行合理的资源调度，避免不必要的虚拟机迁移。资源预测技术是优化云计算资源分配的非常有效的方法[2]。

　　目前资源预测方法较多，对云资源预测的研究大致可以分为两类。第一类预测方法采用经典模型，包括时间序列模型、神经网络模型、支持向量机、马尔科夫模型、贝叶斯模型等。文献[3]利用线性预测方法，如指数移动平均线、二阶自回归移动平均线和移动平均法，预测时间序列数据的工作量。文献[4]为SaaS供应商提供了一个基于自回归移动平均模型（ARIMA）的云工作负载预测模块，提出基于ARIMA模型的预测并使用真实的Web服务器请求数据来评估预测未来工作负载的准确性，此外还评估了预测准确性对资源利用和QoS效率等方面的影响文献[5]利用支持向量机（SVMs）方法的时间序列预测时间序列数据，用于响应时间和吞吐量。文献[6]提出了一种贝叶斯模型，通过在几个数据中心的工作负载模式基础上考虑几个参数，以预测短期和长期的虚拟资源需求。文献[7]分析了云计算的工作负载，并进一步评估了Markov建模和贝叶斯建模等两种预测技术的性能。第二类是针对特定的云工作负载模式进行预测。云环境下现有资源预测模型通常采用单一的预测策略，忽略了其他因素对网络资源的内在作用，导致数据隐含信息丢失量大，所以往往难以取得准确的预测结果的问题。

　　同时，资源类型的异质性和应用的资源需求变化对云中的工作量预测造成了新的挑战。

　　针对这一问题，本文提出一种基于ARIMA-Kalman混合模型预测方法。该方法将卡尔曼滤波与自回归积分滑动平均模型相结合，对工作负载所需的资源进行预测。实验结果表明，与单一模型的预测方法相比，该方法具有更高的预测精度，有效的提高了资源利用率，能够很好为虚拟机资源的按需调度提供帮助。

　　1.预测模型理论

　　1.1 ARIMA模型

　　自回归积分滑动平均模型（ARIMA）[8]属于时间序列预测方法，ARIMA模型对采集到的工作负载执行的历史信息进行拟合，由此预测一个负载在未来的执行时间。ARIMA（p ， d ， q）模型可以表示为：