别再硬背公式了！用Python手把手实现模拟退火算法，搞定TSP和背包问题

weixin_33725126

363人浏览 · 2026-06-03 09:23:40

weixin_33725126 · 2026-06-03 09:23:40 发布

用Python实战模拟退火算法：从TSP到背包问题的工程化实现

当你在深夜盯着屏幕，反复调试那些看似永远无法收敛的算法代码时，是否想过——那些教科书上的数学公式，究竟该如何转化为实际可运行的工程代码？今天，我们将打破理论与实践的壁垒，用Python带你完整实现模拟退火算法（Simulated Annealing, SA），解决旅行商问题（TSP）和背包问题这两个经典的NP难问题。

1. 算法核心：物理直觉与工程思维的碰撞

模拟退火算法的魅力在于它用简单的物理现象解决了复杂的数学问题。想象一下金属退火的过程：高温时原子剧烈运动，随着温度降低逐渐趋于稳定。这种自然现象被抽象为三个关键要素：

状态空间 ：所有可能的解构成的集合（如TSP中所有可能的路径）
能量函数 ：需要最小化的目标函数（如路径总长度）
温度参数 ：控制搜索范围的超参数

# 能量函数示例：TSP问题中的路径总长度
def calculate_total_distance(cities, path):
    total = 0
    for i in range(len(path)):
        from_city = path[i]
        to_city = path[(i+1)%len(path)]
        total += distance(cities[from_city], cities[to_city])
    return total

提示：在工程实现中，能量函数的设计直接影响算法效果。对于TSP问题，通常采用路径总长度；对于背包问题，则可能是价值与重量约束的组合函数。

2. TSP问题实战：从城市坐标到最优路径

2.1 问题建模与邻域设计

TSP问题的核心是找到访问所有城市的最短回路。我们用二维坐标表示城市位置，路径则表示为城市的排列组合。邻域操作是算法探索解空间的关键：

交换操作（Swap） ：随机交换两个城市的位置
逆序操作（Reverse） ：随机选择一段路径进行逆序
插入操作（Insert） ：将某个城市插入到新位置

# 邻域操作实现示例
def reverse_segment(path, i, j):
    return path[:i] + path[i:j+1][::-1] + path[j+1:]

def random_swap(path):
    i, j = random.sample(range(len(path)), 2)
    new_path = path.copy()
    new_path[i], new_path[j] = new_path[j], new_path[i]
    return new_path

2.2 参数调优：温度曲线的艺术

参数设置直接影响算法性能。我们采用指数降温策略，但需要精心设计初始温度和降温速率：

参数	推荐值	影响分析
初始温度	100-1000	过高导致计算冗余，过低限制搜索范围
降温系数	0.85-0.99	决定收敛速度与精度平衡
马尔可夫链长度	100-1000	每个温度下的迭代次数

# 温度调度实现
def temperature_schedule(t, initial_temp, cooling_rate):
    return initial_temp * (cooling_rate ** t)

3. 背包问题实战：离散空间的优化技巧

3.1 二进制编码与约束处理

背包问题的解可以表示为二进制串（1表示选择物品，0表示不选）。关键在于处理重量约束：

生成随机解时确保不超载
邻域操作后检查约束
对不可行解进行惩罚或修复

def generate_valid_solution(weights, capacity):
    while True:
        solution = [random.randint(0,1) for _ in weights]
        if sum(w*s for w,s in zip(weights, solution)) <= capacity:
            return solution

def mutate_solution(solution, mutation_rate=0.1):
    new_solution = solution.copy()
    for i in range(len(new_solution)):
        if random.random() < mutation_rate:
            new_solution[i] = 1 - new_solution[i]
    return new_solution

3.2 价值密度启发式与SA结合

结合贪心算法的思想，我们可以改进初始解生成：

计算每个物品的价值密度（价值/重量）
按密度降序排列
依次选择物品直到背包满载

def greedy_initial_solution(values, weights, capacity):
    density = [v/w for v,w in zip(values, weights)]
    sorted_indices = sorted(range(len(density)), key=lambda i: -density[i])
    solution = [0]*len(values)
    total_weight = 0
    for i in sorted_indices:
        if total_weight + weights[i] <= capacity:
            solution[i] = 1
            total_weight += weights[i]
    return solution

4. 工程优化：加速收敛的实用技巧

4.1 记忆最优解机制

在标准SA中，可能会接受劣质解导致丢失当前最优。我们可以增加记忆功能：

best_solution = None
best_energy = float('inf')

for t in range(max_iter):
    # ...SA主循环...
    if current_energy < best_energy:
        best_energy = current_energy
        best_solution = current_solution.copy()

4.2 自适应参数调整

根据搜索进展动态调整参数：

当连续多次未改进时，提高温度重新"激活"搜索
根据接受率调整马尔可夫链长度
动态改变邻域搜索范围

acceptance_rate = accepted_moves / total_moves
if acceptance_rate < 0.1:
    temperature *= 1.5  # 重新加热
elif acceptance_rate > 0.5:
    markov_length = int(markov_length * 1.1)  # 增加搜索深度

4.3 并行化实现

利用多核CPU加速计算：

from multiprocessing import Pool

def parallel_trial(args):
    # 独立的SA运行
    return simulated_annealing(*args)

with Pool() as p:
    results = p.map(parallel_trial, [(problem, params) for _ in range(4)])
best_solution = min(results, key=lambda x: x[1])

5. 可视化与调试：看见算法的思考过程

5.1 TSP路径演化

import matplotlib.pyplot as plt

def plot_tsp_solution(cities, path, title=""):
    plt.figure(figsize=(10,6))
    plt.scatter(cities[:,0], cities[:,1])
    for i in range(len(path)):
        start = path[i]
        end = path[(i+1)%len(path)]
        plt.plot([cities[start,0], cities[end,0]], 
                 [cities[start,1], cities[end,1]], 'r-')
    plt.title(title)
    plt.show()

5.2 能量变化曲线

跟踪能量随迭代的变化，判断算法是否正常收敛：

energies = []  # 记录每次迭代的能量值
plt.plot(energies)
plt.xlabel('Iteration')
plt.ylabel('Energy')
plt.title('Energy Convergence')

6. 进阶挑战：当标准SA不够用时

6.1 混合算法设计

结合局部搜索（如2-opt）提升SA性能：

def two_opt_improvement(path, cities):
    improved = True
    while improved:
        improved = False
        for i in range(1, len(path)-2):
            for j in range(i+1, len(path)):
                if j-i == 1: continue
                new_path = path[:i] + path[i:j][::-1] + path[j:]
                if calculate_total_distance(cities, new_path) < calculate_total_distance(cities, path):
                    path = new_path
                    improved = True
    return path

6.2 多目标优化扩展

对于需要考虑多个目标的场景（如背包问题中的价值和重量）：

def multi_objective_energy(solution, values, weights, capacity):
    total_value = sum(v*s for v,s in zip(values, solution))
    total_weight = sum(w*s for w,s in zip(weights, solution))
    if total_weight > capacity:
        return -total_value  # 惩罚不可行解
    return -total_value  # 最大化价值转化为最小化负价值

在实现这些算法时，最令人惊喜的发现是：看似简单的温度调度策略背后，其实蕴含着对搜索空间探索与开发精妙的平衡艺术。当第一次看到算法跳出局部最优，找到全局最优解的那一刻，所有调试的煎熬都变得值得。

亚马逊云科技技术品牌专区

更多推荐

TonY与YARN集成原理：深度学习任务的资源调度与隔离机制

TonY是一个能让深度学习框架原生运行在Apache Hadoop上的框架，它通过与YARN的深度集成，实现了对深度学习任务的高效资源调度与隔离。本文将深入解析TonY与YARN集成的核心原理，帮助读者理解如何在Hadoop集群上稳定运行大规模深度学习任务。## 一、TonY与YARN集成的架构设计 🚀TonY与YARN的集成架构主要由**TonyClient**、**Resource

亚马逊云科技技术品牌专区

2026年麒麟KYCP云计算认证深度解析：高级信创云人才的能力标尺

麒麟KYCP云计算是信创云平台高级运维认证，由工信部与麒麟软件联合颁发，聚焦KVM虚拟化、Kubernetes编排及信创云安全架构。考试含100题（单选70+多选20+判断10），90分钟需达70分合格，较初级KYCA难度显著提升。持证者可胜任政企信创云架构师等岗位，契合2026年信创规模化落地的人才缺口。备考建议分四阶段：基础巩固（1周）、K8s进阶（2-3周）、安全强化（1周）及模拟冲刺，需重