数据平滑：使用 Python 抚平波动177

数据平滑是一种技术，用于从数据中去除噪声和波动，从而揭示底层趋势和模式。在 Python 中，有几种方法可以实现数据平滑，包括：

1. 移动平均

移动平均是一种简单但有效的平滑算法。该算法通过将相邻数据点的平均值作为平滑数据点：```python
import numpy as np
def moving_average(data, window_size):
return (data, (window_size), 'valid') / window_size
```

其中 `window_size` 指定要使用的移动窗口的大小。

2. 指数加权移动平均 (EWMA)

EWMA 是一种更复杂但更有效的平滑算法。该算法通过对过去数据点赋予更高的权重，并将它们与当前数据点进行加权平均：```python
def ewma(data, alpha):
alpha = min(1.0, alpha)
return (data[0], alpha * data[1:] + (1 - alpha) * ewma(data[:-1], alpha))
```

其中 `alpha` 指定权重平滑程度。

3. 卡尔曼滤波

卡尔曼滤波是一种递归算法，用于估计动态系统的状态。该算法将测量值与系统的模型相结合，以提供最优状态估计：```python
from import expm
def kalman_filter(A, B, C, Q, R, y):
x = ([0])
P = ([0])
for i in range([0]):
x = (x) + (u[i])
P = (P).dot(A.T) + Q
K = (C.T).dot(((P).dot(C.T) + R))
x = x + (y[i] - (x))
P = (([0]) - (C)).dot(P)
return x
```

其中 `A`, `B`, `C`, `Q`, `R` 分别是系统矩阵、输入矩阵、测量矩阵、过程噪声协方差和测量噪声协方差。

4. 洛埃斯 (LOESS) 回归

LOESS 回归是一种非参数平滑算法，通过使用局部加权线性回归来估计数据点的平滑值：```python
import as sm
def loess(data, span=0.2):
return (data, (len(data)), span=span)
```

其中 `span` 指定局部加权的带宽。

5. 萨维茨基-戈莱 (Savitzky-Golay) 滤波器

萨维茨基-戈莱滤波器是一种平滑算法，通过拟合多项式到数据点然后计算多项式的值来平滑数据：```python
import numpy as np
def savgol_filter(data, window_size, order):
return (data, (((window_size), data[:window_size], order), (len(data))), 'valid')
```

其中 `window_size` 指定窗口大小，`order` 指定多项式的阶数。

选择适当的算法

选择最佳的数据平滑算法取决于数据类型和所需的结果。对于简单的噪声去除，移动平均就足够了。对于较复杂的数据，EWMA 或卡尔曼滤波器可能是更好的选择。LOESS 回归适合非参数数据，而萨维茨基-戈莱滤波器适用于需要保留峰值和谷值的数据。

2024-10-22

上一篇：数据建模之 Python 圣经：从入门到精通

下一篇：掌握 Python 数据科学，开启数据驱动的职业生涯