用Python玩转模拟退火算法：从物理退火到TSP路径优化的保姆级代码拆解

眠子子子

250人浏览 · 2026-05-30 09:12:09

眠子子子 · 2026-05-30 09:12:09 发布

Python实现模拟退火算法：从金属冷却到旅行商问题的奇妙之旅

想象一下，你是一位铁匠，正在打造一把完美的剑。你将金属加热至白热化，然后缓慢冷却，让金属内部的原子找到最稳定的排列方式。这种古老的工艺，竟然与现代计算机科学中的优化算法有着惊人的相似之处。这就是我们今天要探讨的模拟退火算法——一种将物理现象转化为数学智慧的经典案例。

对于Python开发者来说，模拟退火算法不仅是一个强大的优化工具，更是一次理解自然与算法美妙联系的绝佳机会。我们将从物理退火的基本原理出发，逐步构建算法框架，最终实现一个完整的旅行商问题(TSP)求解器。在这个过程中，你会看到温度参数如何控制搜索过程，Metropolis准则如何帮助算法跳出局部最优，以及Python如何优雅地实现这些复杂概念。

1. 物理退火与算法思想的桥梁

金属退火是一个历经千年的工艺过程。当金属被加热到极高温度时，其内部粒子获得足够能量进行随机运动；随着温度缓慢降低，粒子逐渐趋向于能量最低的稳定排列状态。这一物理现象在1983年被Kirkpatrick等人抽象为一种优化算法，用于解决复杂的组合优化问题。

在算法视角下，金属的"能量状态"对应着我们需要优化的目标函数值，而"温度"则成为控制算法探索行为的关键参数。高温时，算法像熔化的金属一样自由探索解空间；随着温度降低，算法逐渐聚焦于有希望的搜索区域，最终"结晶"出一个优质解。

核心对应关系 ：

物理系统能量 → 目标函数值
粒子排列状态 → 问题的候选解
温度参数 → 控制搜索随机性的变量
冷却速率 → 算法收敛速度

# 温度衰减的简单实现
def temperature_cooling(initial_temp, cooling_rate, iteration):
    return initial_temp * (cooling_rate ** iteration)

这个简单的温度衰减公式体现了算法如何模拟物理冷却过程。选择合适的冷却速率(cooling_rate)至关重要——太快会导致"淬火"(陷入局部最优)，太慢则增加不必要的计算开销。

2. 算法核心：Metropolis准则的Python实现

Metropolis准则是模拟退火算法的灵魂所在，它决定了何时接受一个"更差"的解，从而使算法有机会跳出局部最优陷阱。这一准则源自统计力学，描述了物理系统在恒定温度下达到热平衡的状态转移概率。

对于极小化问题(如TSP)，当新解的目标值(路径长度)优于当前解时，我们总是接受这个改进；当新解更差时，我们以一定概率接受它，这个概率取决于"恶化程度"和当前温度：

import math
import random

def metropolis_acceptance(delta, temperature):
    if delta < 0:  # 新解更优
        return True
    else:  # 新解更差，以概率接受
        probability = math.exp(-delta / temperature)
        return random.random() < probability

关键参数实践建议 ：

初始温度：应足够高，使得算法初期有足够探索能力
终止温度：接近零时停止，此时只接受改进解
马尔可夫链长度：每个温度下的迭代次数，通常与问题规模相关
冷却系数：0.8-0.99之间，控制温度下降速度

下表展示了不同温度下接受劣解的概率变化：

Δf (目标值变化)	T=1000	T=100	T=10	T=1
+5	99.5%	95.1%	60.7%	0.7%
+10	99.0%	90.5%	36.8%	0.0%
+50	95.1%	60.7%	0.7%	0.0%

3. 旅行商问题的建模与邻域设计

旅行商问题(TSP)是组合优化中最著名的问题之一：给定一系列城市和它们之间的距离，找到访问每座城市一次并返回起点的最短路径。这个问题看似简单，但随着城市数量增加，解空间呈阶乘级膨胀，成为测试优化算法的经典基准。

TSP解的表示 ：我们采用排列编码，即城市访问顺序的排列。例如，对于5个城市的问题，[0,2,1,4,3]表示一种可能的路径。

邻域结构设计 ：算法需要通过当前解生成"邻近"的新解。我们实现三种常用方法：

import numpy as np

def swap_two_cities(solution):
    """交换随机两个城市的位置"""
    i, j = np.random.choice(len(solution), 2, replace=False)
    new_solution = solution.copy()
    new_solution[i], new_solution[j] = new_solution[j], new_solution[i]
    return new_solution

def reverse_segment(solution):
    """反转随机选择的子路径"""
    i, j = sorted(np.random.choice(len(solution), 2, replace=False))
    new_solution = solution.copy()
    new_solution[i:j+1] = new_solution[i:j+1][::-1]
    return new_solution

def insert_city(solution):
    """随机选择一个城市插入到另一位置"""
    city = np.random.randint(len(solution))
    new_solution = np.delete(solution, city)
    insert_pos = np.random.randint(len(new_solution))
    return np.insert(new_solution, insert_pos, solution[city])

目标函数计算 ：路径总长度是各段距离之和，包括返回起点的最后一段：

def calculate_distance(solution, distance_matrix):
    total = 0
    for i in range(len(solution)-1):
        total += distance_matrix[solution[i]][solution[i+1]]
    total += distance_matrix[solution[-1]][solution[0]]  # 返回起点
    return total

4. 完整Python实现与可视化

现在我们将所有组件整合成一个完整的模拟退火算法实现，并添加可视化功能来观察算法运行过程。

import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation

class TSPSolver:
    def __init__(self, cities, distance_matrix):
        self.cities = cities
        self.dist_matrix = distance_matrix
        self.num_cities = len(cities)
        self.best_solution = None
        self.best_distance = float('inf')
        self.history = []
        
    def generate_initial_solution(self):
        return np.random.permutation(self.num_cities)
    
    def perturb_solution(self, solution):
        method = np.random.choice(['swap', 'reverse', 'insert'])
        if method == 'swap':
            return swap_two_cities(solution)
        elif method == 'reverse':
            return reverse_segment(solution)
        else:
            return insert_city(solution)
    
    def run_annealing(self, initial_temp=10000, final_temp=0.1, 
                     cooling_rate=0.95, iterations_per_temp=100):
        current_temp = initial_temp
        current_solution = self.generate_initial_solution()
        current_distance = calculate_distance(current_solution, self.dist_matrix)
        
        while current_temp > final_temp:
            for _ in range(iterations_per_temp):
                new_solution = self.perturb_solution(current_solution)
                new_distance = calculate_distance(new_solution, self.dist_matrix)
                delta = new_distance - current_distance
                
                if metropolis_acceptance(delta, current_temp):
                    current_solution = new_solution
                    current_distance = new_distance
                    
                    if current_distance < self.best_distance:
                        self.best_solution = current_solution.copy()
                        self.best_distance = current_distance
                        self.history.append((current_temp, self.best_distance))
            
            current_temp *= cooling_rate
        
        return self.best_solution, self.best_distance
    
    def plot_solution(self, solution=None):
        if solution is None:
            solution = self.best_solution
        x = [self.cities[i][0] for i in solution] + [self.cities[solution[0]][0]]
        y = [self.cities[i][1] for i in solution] + [self.cities[solution[0]][1]]
        
        plt.figure(figsize=(10, 6))
        plt.plot(x, y, 'o-', markersize=8)
        plt.title(f'TSP Solution - Total Distance: {calculate_distance(solution, self.dist_matrix):.2f}')
        plt.xlabel('X Coordinate')
        plt.ylabel('Y Coordinate')
        plt.grid(True)
        plt.show()
    
    def plot_convergence(self):
        temps, distances = zip(*self.history)
        plt.figure(figsize=(10, 5))
        plt.plot(distances)
        plt.title('Optimization Progress')
        plt.xlabel('Iteration')
        plt.ylabel('Best Distance')
        plt.grid(True)
        plt.show()

使用示例 ：

# 生成随机城市坐标
np.random.seed(42)
num_cities = 20
cities = np.random.rand(num_cities, 2) * 100

# 计算距离矩阵
distance_matrix = np.zeros((num_cities, num_cities))
for i in range(num_cities):
    for j in range(num_cities):
        dx = cities[i,0] - cities[j,0]
        dy = cities[i,1] - cities[j,1]
        distance_matrix[i,j] = np.sqrt(dx*dx + dy*dy)

# 创建并运行求解器
solver = TSPSolver(cities, distance_matrix)
best_solution, best_distance = solver.run_annealing(
    initial_temp=10000, 
    final_temp=0.1,
    cooling_rate=0.95,
    iterations_per_temp=100
)

# 可视化结果
print(f"Best solution found: {best_solution}")
print(f"Total distance: {best_distance:.2f}")
solver.plot_solution()
solver.plot_convergence()

性能优化技巧 ：

增量计算：避免每次完全重新计算路径长度，只计算变化部分
并行化：在不同温度下可以并行评估多个候选解
自适应冷却：根据搜索进度动态调整冷却速率
记忆机制：保留历史上发现的优质解，防止丢失

模拟退火算法的魅力在于它能够平衡"探索"与"开发"，在随机性和确定性之间找到优雅的平衡点。通过调整温度参数和邻域结构，这个框架可以适应各种优化问题，从物流路径规划到集成电路设计，从机器学习超参数调优到金融投资组合优化。

亚马逊云科技技术品牌专区

更多推荐

Cursor + GitOps：自动化运维新姿势

Cursor 与 GitOps 的结合，标志着运维自动化从“脚本化”向“智能化”演进的关键一步。它并非要取代工程师，而是将其从重复劳动中解放出来，更专注于架构设计、复杂问题解决和流程优化。拥抱这一新姿势，意味着以更优雅、高效的方式驾驭云原生时代的运维复杂性。

亚马逊云科技技术品牌专区

主动推理-人工海马

2026年07月04日 00:21发言人00:00制造能够思考的机器是人类长久以来的梦想，但这到底意味着什么呢？智能的一个显著特性是能够泛化知识，并灵活地将其应用于新情况。这种泛化确实是现代机器学习的核心问题之一。在这段视频中，我们将探讨如何汲取海马体负责记忆和导航的大脑结构的生物学组织，来构建一个能够学习构建抽象和泛化的计算模型。我们将探索这个模型带给我们关于大脑自身及人工智能领域的启示。发言人

亚马逊云科技技术品牌专区

Java分布式架构设计方法

服务拆分后，服务间的通信成为关键。事件驱动架构是另一种有效解耦和数据同步的方式，服务通过发布/订阅领域事件进行通信，借助Apache Kafka或RabbitMQ等消息中间件，可以实现事件的可靠传递与异步处理，提升系统整体响应能力。从业务拆分出发，选择恰当的通信与治理模式，妥善处理数据一致性，并构建完善的运维支撑体系。随着云原生理念的深入，Serverless、Service Mesh等新技术也在