灰色预测概述

\[ \hat{\boldsymbol{a}} = \begin{pmatrix} a \ b \end{pmatrix} = \left( \boldsymbol{B}^T \boldsymbol{B} \right)^{-1} \boldsymbol{B}^T \boldsymbol{Y} \]

其中：

\[ \boldsymbol{B} = \begin{pmatrix} -z^{(1)}(2) & 1 \ -z^{(1)}(3) & 1 \ \vdots & \vdots \ -z^{(1)}(n) & 1 \end{pmatrix}, \quad \boldsymbol{Y} = \begin{pmatrix} x^{(0)}(2) \ x^{(0)}(3) \ \vdots \ x^{(0)}(n) \end{pmatrix} \]

求解微分方程得到时间响应函数：

\[ \hat{x}^{(1)}(k+1) = \left( x^{(0)}(1) - \frac{b}{a} \right) e^{-ak} + \frac{b}{a}, \quad k = 0, 1, 2, \ldots \]

通过累减生成还原得到预测值：

\[ \hat{x}^{(0)}(k+1) = \hat{x}^{(1)}(k+1) - \hat{x}^{(1)}(k) = \left(1 - e^a\right)\left( x^{(0)}(1) - \frac{b}{a} \right) e^{-ak} \]

GM(2,1) 模型

GM(2,1) 模型为二阶单变量灰色模型，适用于原始数据波动较大、GM(1,1) 拟合效果不理想的情况。其白化微分方程为：

\[ \frac{d^2 x^{(1)}}{dt^2} + a_1 \frac{dx^{(1)}}{dt} + a_2 x^{(1)} = b \]

GM(1,N) 模型

GM(1,N) 模型为一阶多变量灰色模型，适用于存在多个相关因素的情况。其白化微分方程为：

\[ \frac{dx_1^{(1)}}{dt} + a x_1^{(1)} = \sum_{i=2}^{N} b_i x_i^{(1)} \]

其中 \( x_1 \) 为系统特征序列，\( x_2, x_3, \ldots, x_N \) 为相关因素序列。

残差修正 GM(1,1)：利用残差序列建立辅助模型修正预测值
新陈代谢 GM(1,1)：动态更新建模数据，加入新数据、剔除旧数据
无偏 GM(1,1)：消除传统模型的系统偏差
灰色马尔可夫模型：结合马尔可夫链修正灰色预测的波动

适用条件（级比检验）

在建立 GM(1,1) 模型之前，必须对原始数据进行级比检验，以判断该数据是否适合使用灰色预测模型。

级比的定义

对原始序列 \( x^{(0)} = \left( x^{(0)}(1), x^{(0)}(2), \ldots, x^{(0)}(n) \right) \)，计算其级比：

\[ \lambda(k) = \frac{x^{(0)}(k-1)}{x^{(0)}(k)}, \quad k = 2, 3, \ldots, n \]

级比检验条件

若所有级比 \( \lambda(k) \) 满足：

\[ \lambda(k) \in \left( e^{-\frac{2}{n+1}}, , e^{\frac{2}{n+1}} \right) \]

则认为原始序列 \( x^{(0)} \) 可以建立 GM(1,1) 模型，且模型具有较好的预测精度。

当 \( n \) 较大时，该区间近似为 \( (1 - \frac{2}{n+1}, , 1 + \frac{2}{n+1}) \)。

级比检验不通过的处理方法

若级比检验不通过，可采取以下措施：

平移变换：对原始序列做平移变换 \( y^{(0)}(k) = x^{(0)}(k) + c \)，选择适当的常数 \( c \) 使新序列通过级比检验
对数变换：取对数后再建模
取部分数据：选择满足条件的子序列进行建模
采用其他模型：如 GM(2,1) 或 Verhulst 模型

模型精度检验

建模完成后，需要进行精度检验以评价模型的预测效果：

残差检验：计算相对误差

\[ \varepsilon(k) = \frac{x^{(0)}(k) - \hat{x}^{(0)}(k)}{x^{(0)}(k)} \times 100% \]

平均相对误差：

\[ \bar{\varepsilon} = \frac{1}{n-1} \sum_{k=2}^{n} |\varepsilon(k)| \]

后验差检验：计算后验差比值 \( C \) 和小误差概率 \( P \)

\[ C = \frac{S_2}{S_1} \]

其中 \( S_1 \) 为原始序列的标准差，\( S_2 \) 为残差序列的标准差。

\[ P = P\left{ |e(k) - \bar{e}| < 0.6745 S_1 \right} \]

精度等级判断标准如下表：

精度等级	平均相对误差 \( \bar{\varepsilon} \)	后验差比值 \( C \)	小误差概率 \( P \)
一级（好）	< 1%	< 0.35	> 0.95
二级（合格）	< 5%	< 0.50	> 0.80
三级（勉强）	< 10%	< 0.65	> 0.70
四级（不合格）	>= 10%	>= 0.65	<= 0.70

发展系数 a 的取值范围

GM(1,1) 模型的预测精度与发展系数 \( a \) 密切相关：

当 \( |a| \leq 0.3 \) 时，GM(1,1) 模型可用于中长期预测
当 \( 0.3 < |a| \leq 0.5 \) 时，模型应谨慎使用，适合短期预测
当 \( 0.5 < |a| \leq 1 \) 时，模型仅适用于短期预测，需结合残差修正
当 \( |a| > 1 \) 时，不宜使用 GM(1,1) 模型

与其他预测方法对比

灰色预测在预测方法体系中具有独特的定位，了解其与其他方法的异同有助于在建模中做出正确的选择。

灰色预测与回归分析对比

对比维度	灰色预测	回归分析
数据量要求	少量（4个以上）	较多（通常30个以上）
数据分布假设	无特定分布假设	需满足正态性等假设
建模对象	累加生成序列	原始数据
数学基础	微分方程	统计学
适用场景	小样本、趋势明显	大样本、关系明确

灰色预测与时间序列分析对比

对比维度	灰色预测	时间序列（ARIMA）
数据量要求	4个以上即可	通常需50个以上
平稳性要求	不要求平稳	要求平稳或可差分为平稳
处理方式	累加生成	差分、自回归
模型复杂度	简单，参数少	较复杂，需定阶
短期预测	精度较高	精度高
长期预测	精度下降明显	同样存在精度下降

灰色预测与神经网络对比

对比维度	灰色预测	神经网络
数据量要求	极少	大量
可解释性	有明确的数学表达	黑箱模型
计算复杂度	低	高
非线性处理	有限	强
过拟合风险	小	较大
模型选择	简单明确	需大量调参