从信号处理到图像压缩：用Python和NumPy手把手实现一个简易傅里叶变换

weixin_33743661

354人浏览 · 2026-06-03 14:51:45

weixin_33743661 · 2026-06-03 14:51:45 发布

从信号处理到图像压缩：用Python和NumPy手把手实现一个简易傅里叶变换

傅里叶变换是现代数字信号处理的基石，它像一把瑞士军刀，能帮我们把复杂的波形拆解成简单的正弦波组合。想象一下，当你用手机听音乐时，那些高低起伏的声波；或者浏览网页时，那些色彩斑斓的图片——背后都有傅里叶变换的身影。本文将带你用Python和NumPy，从零开始实现一个简易的傅里叶变换，并探索它在图像压缩中的神奇应用。

1. 傅里叶变换基础：从数学到代码

傅里叶变换的核心思想很简单：任何周期函数都可以表示为不同频率正弦波和余弦波的叠加。在数字信号处理中，我们常用离散傅里叶变换(DFT)，它的数学表达式如下：

X[k] = Σ x[n] * e^(-j*2πkn/N)  # 其中n从0到N-1

这个公式看起来复杂，但用NumPy实现起来却出奇地简单。让我们先创建一个简单的正弦波信号：

import numpy as np
import matplotlib.pyplot as plt

# 生成一个简单的正弦波信号
sample_rate = 1000  # 采样率(Hz)
duration = 1.0      # 信号持续时间(秒)
frequency = 50       # 信号频率(Hz)

t = np.linspace(0, duration, int(sample_rate * duration), endpoint=False)
signal = np.sin(2 * np.pi * frequency * t)

表：傅里叶变换中的重要参数说明

参数	描述	典型值
采样率	每秒采集的样本数	1000-44100Hz
信号长度	样本点的总数	通常为2的幂次方
频率分辨率	能区分的最小频率差	采样率/信号长度

注意：在实际应用中，我们通常使用快速傅里叶变换(FFT)算法，它比直接计算DFT要高效得多，时间复杂度从O(N²)降到O(N log N)。

2. 实现简易傅里叶变换

虽然NumPy已经提供了高效的 np.fft.fft 函数，但为了深入理解原理，我们先自己实现一个简单的DFT：

def simple_dft(signal):
    N = len(signal)
    n = np.arange(N)
    k = n.reshape((N, 1))
    e = np.exp(-2j * np.pi * k * n / N)
    return np.dot(e, signal)

这个实现虽然直观，但效率不高。让我们对比一下自实现和NumPy内置的FFT：

# 比较两种实现
fft_result = np.fft.fft(signal)
dft_result = simple_dft(signal)

print("最大误差:", np.max(np.abs(fft_result - dft_result)))

常见问题及解决方案：

频谱泄漏 ：当信号长度不是信号周期的整数倍时，会出现频谱泄漏。解决方法是用窗函数(如汉宁窗)平滑信号边缘。
频率混叠 ：当采样率不足时，高频信号会"混入"低频部分。根据奈奎斯特定理，采样率应至少是信号最高频率的两倍。
计算效率 ：对于长信号，自实现DFT会很慢，应使用FFT算法。

3. 从信号处理到图像分析

傅里叶变换在图像处理中同样威力巨大。图像可以看作二维信号，我们可以用二维傅里叶变换来分析其频率成分：

from PIL import Image

# 加载图像并转换为灰度
image = Image.open('sample.jpg').convert('L')
image_data = np.array(image)

# 二维傅里叶变换
fft_image = np.fft.fft2(image_data)
fft_shifted = np.fft.fftshift(fft_image)  # 将低频移到中心
magnitude_spectrum = 20 * np.log(np.abs(fft_shifted))

图像傅里叶变换的关键观察点：

低频成分(频谱中心)对应图像的整体结构和大致轮廓
高频成分(频谱边缘)对应图像的细节和边缘信息
不同方向的频率成分对应图像中不同方向的边缘

4. 图像压缩实战：保留关键频率

理解了频率成分的意义，我们就可以尝试图像压缩——只保留重要的频率成分：

def compress_image(image_data, keep_fraction=0.1):
    # 执行FFT
    fft_image = np.fft.fft2(image_data)
    
    # 只保留部分频率成分
    rows, cols = image_data.shape
    fft_image[int(rows*keep_fraction):int(rows*(1-keep_fraction))] = 0
    fft_image[:, int(cols*keep_fraction):int(cols*(1-keep_fraction))] = 0
    
    # 逆变换
    compressed_image = np.fft.ifft2(fft_image).real
    
    return compressed_image

不同压缩率下的效果对比：

压缩率	保留频率比例	图像质量	文件大小减少
低	30%	几乎无损	~50%
中	15%	轻微模糊	~75%
高	5%	明显模糊	~90%

在实际项目中，JPEG等图像格式正是利用类似的原理，通过离散余弦变换(DCT)实现高效的图像压缩。理解傅里叶变换，就掌握了现代多媒体技术的核心密码。

亚马逊云科技技术品牌专区

更多推荐

LoRA（低秩适配）：大模型高效微调的革命性技术

LoRA（低秩适配）是一种高效的大模型微调技术，通过冻结预训练模型权重并注入低秩可训练矩阵，显著降低计算和存储成本。相比全量微调，LoRA参数减少90%以上，显存需求降至3-8GB，训练时间缩短至数小时，且支持灵活任务切换。其核心优势包括低硬件门槛、高效训练和部署灵活性，适用于垂直领域适配、生成式AI定制等场景。经验表明，秩r=4或8通常效果良好，但LoRA在数据量极大或任务复杂时可能受限。技术演