Python实战：用贪心算法搞定找零、排活动和压缩数据（附避坑指南）

大厂男孩的粉丝

332人浏览 · 2026-05-30 15:53:48

大厂男孩的粉丝 · 2026-05-30 15:53:48 发布

Python实战：用贪心算法搞定找零、排活动和压缩数据（附避坑指南）

贪心算法就像一位精明的商人，总能在每个决策点做出最有利的选择。这种"活在当下"的策略虽然简单，却在许多实际问题中展现出惊人的效率。本文将带你用Python实现三个经典场景中的贪心算法应用，同时揭示那些教科书上不会告诉你的实战陷阱。

1. 找零问题的艺术与陷阱

在咖啡馆当收银员时，你是否思考过如何用最少的硬币找零？这个问题看似简单，却隐藏着算法选择的智慧。

1.1 基础贪心实现

我们先看一个典型的美式硬币系统（1,5,10,25美分）的实现：

def make_change(amount, coins=[1,5,10,25]):
    coins.sort(reverse=True)
    change = []
    for coin in coins:
        while amount >= coin:
            change.append(coin)
            amount -= coin
    return change if amount == 0 else None

print(make_change(63))  # [25, 25, 10, 1, 1, 1]

这个实现有两个关键点：

降序排列硬币面额 ：确保优先使用大面额
循环扣除 ：尽可能多地使用当前最大面额

1.2 当贪心失效的案例

不是所有硬币系统都适合贪心算法。考虑这个特殊系统：[1,3,4]美分，要找6美分：

print(make_change(6, [1,3,4]))  # [4,1,1] 而非最优解 [3,3]

这里贪心算法给出了次优解。判断一个硬币系统是否适合贪心策略，可以参考 Matula定理 ：当且仅当每个硬币面额都至少是前一个面额的两倍时，贪心算法才能保证最优解。

1.3 实战建议

在真实金融系统中，建议先用贪心算法快速处理
对特殊货币系统，实现一个动态规划的后备方案：

def dp_change(amount, coins):
    min_coins = [float('inf')]*(amount+1)
    min_coins[0] = 0
    for coin in coins:
        for i in range(coin, amount+1):
            min_coins[i] = min(min_coins[i], min_coins[i-coin]+1)
    return min_coins[amount] if min_coins[amount] != float('inf') else -1

2. 活动安排中的时间魔法

会议室预定、课程排期、广告位投放...这些本质上都是活动选择问题。贪心算法在这里的表现堪称完美。

2.1 经典实现

def schedule_activities(activities):
    # 按结束时间排序
    sorted_acts = sorted(activities, key=lambda x: x[1])
    selected = [sorted_acts[0]]
    for act in sorted_acts[1:]:
        if act[0] >= selected[-1][1]:
            selected.append(act)
    return selected

meetings = [(9,10),(9:30,10:30),(10,11),(10:30,11:30)]
print(schedule_activities(meetings))  # [(9,10), (10,11)]

关键点 ：选择最早结束的活动，为后续留出最多时间。

2.2 现实中的变种问题

实际场景往往更复杂，比如：

带权重的活动选择 ：每个活动有不同价值
资源受限 ：多个会议室可用
活动关联 ：某些活动必须连续进行

对于带权重的情况，贪心可能失效，需要结合动态规划：

def weighted_schedule(activities):
    activities.sort(key=lambda x: x[1])  # 按结束时间排序
    dp = [0]*len(activities)
    dp[0] = activities[0][2]  # 第三个元素是权重
    
    for i in range(1, len(activities)):
        # 找到不冲突的前一个活动
        j = i-1
        while j >=0 and activities[j][1] > activities[i][0]:
            j -= 1
        include = activities[i][2] + (dp[j] if j >=0 else 0)
        exclude = dp[i-1]
        dp[i] = max(include, exclude)
    return dp[-1]

3. 霍夫曼编码：数据压缩的基石

从ZIP压缩到MP3编码，霍夫曼算法无处不在。它的核心思想很简单：高频字符用短码，低频字符用长码。

3.1 Python实现详解

from heapq import heappush, heappop

class HuffmanNode:
    def __init__(self, char=None, freq=0, left=None, right=None):
        self.char = char
        self.freq = freq
        self.left = left
        self.right = right
    
    def __lt__(self, other):
        return self.freq < other.freq

def build_huffman_tree(text):
    freq = {}
    for char in text:
        freq[char] = freq.get(char, 0) + 1
    
    heap = []
    for char, count in freq.items():
        heappush(heap, HuffmanNode(char=char, freq=count))
    
    while len(heap) > 1:
        left = heappop(heap)
        right = heappop(heap)
        merged = HuffmanNode(freq=left.freq+right.freq, left=left, right=right)
        heappush(heap, merged)
    
    return heappop(heap)

def generate_codes(root, current_code="", codes={}):
    if root is None:
        return
    
    if root.char is not None:
        codes[root.char] = current_code
        return
    
    generate_codes(root.left, current_code+"0", codes)
    generate_codes(root.right, current_code+"1", codes)
    
    return codes

sample = "this is an example for huffman encoding"
tree = build_huffman_tree(sample)
codes = generate_codes(tree)
print(codes)

3.2 性能优化技巧

优先队列选择 ：Python的 heapq 对小数据集足够，但对大数据考虑 queue.PriorityQueue
频率统计优化 ：对超长文本，使用 collections.Counter 更高效
并行处理 ：对超大文件可分块统计频率后合并

3.3 实际应用中的坑

编码表传输 ：压缩文件必须包含编码表
非文本数据 ：需要先将二进制数据转换为符号序列
动态编码 ：对数据流场景需要自适应霍夫曼编码

4. 如何识别贪心适用的问题

不是所有问题都适合贪心算法。以下是判断标准：

特征	适合贪心	不适合贪心
最优子结构	✅ 存在	❌ 不存在
贪心选择性	✅ 成立	❌ 不成立
问题规模	✅ 较大	❌ 较小
解的质量要求	✅ 近似解可接受	❌ 必须最优解

4.1 贪心vs动态规划

贪心算法和动态规划经常被拿来比较：

# 斐波那契数列的两种解法对比

# 贪心解法（实际是记忆化递归）
def fib_greedy(n, memo={}):
    if n in memo: return memo[n]
    if n <= 2: return 1
    memo[n] = fib_greedy(n-1) + fib_greedy(n-2)
    return memo[n]

# 动态规划解法
def fib_dp(n):
    if n <= 2: return 1
    dp = [0]*(n+1)
    dp[1] = dp[2] = 1
    for i in range(3, n+1):
        dp[i] = dp[i-1] + dp[i-2]
    return dp[n]

4.2 贪心算法的测试策略

为确保贪心算法的正确性，建议：

极端值测试 ：输入为空、单个元素等情况
反例测试 ：尝试构造使贪心失效的案例
随机测试 ：生成大量随机输入验证
性能测试 ：与暴力解法对比执行时间

import random
import time

def test_greedy():
    # 随机生成100个测试用例
    for _ in range(100):
        coins = sorted(set(random.randint(1,100) for _ in range(random.randint(3,10))), reverse=True)
        amount = random.randint(1, 1000)
        
        start = time.time()
        greedy_result = make_change(amount, coins.copy())
        greedy_time = time.time() - start
        
        start = time.time()
        dp_result = dp_change(amount, coins.copy())
        dp_time = time.time() - start
        
        # 验证贪心解是否有效（如果存在）
        if greedy_result:
            assert sum(greedy_result) == amount
            # 如果是规范硬币系统，应该是最优解
            if all(coins[i] >= 2*coins[i+1] for i in range(len(coins)-1)):
                assert len(greedy_result) == dp_result

贪心算法就像编程世界里的瑞士军刀——简单、锋利，但需要明智地选择使用场景。当我在处理实时交易系统时，贪心算法的高效性让它成为处理大量小额找零的不二之选。但对于关键任务系统，总是会保留一个动态规划的备选方案，毕竟在计算机科学中，没有放之四海而皆准的银弹。

亚马逊云科技技术品牌专区

更多推荐

【中小学AI人工智能教育】图像生成——Anime Faces风格的头像实验、GAN参数计算

亚马逊云科技技术品牌专区

2026实战｜RPA工程师真相 + 0基础入行 + 攻略（含超级自动化 + AI+RPA），看完直接落地

超级自动化（Hyperautomation）不是单一工具，而是技术组合拳RPA（机器人流程自动化）AI/ML（人工智能/机器学习）iBPMS（智能业务流程管理）集成平台（iPaaS）低代码/无代码工具RPA工程师不是“昙花一现”的岗位，而是数字化转型的基石角色。随着超级自动化和AI技术的融合，这个岗位的技术内涵和价值正在不断提升。技术是基础，业务是核心——最优秀的RPA工程师是“懂技术的业务专家”

亚马逊云科技技术品牌专区

C# ESP32/STM32 轻量 Web 能力库：PicoServer.Nano

简单说一下这两类芯片的定位：ESP32 集成 Wi-Fi/蓝牙，开发快、性价比高，是智能家居、物联网项目的热门选择；STM32 则以丰富的外设、强大的实时响应和工业级稳定性著称，在工业控制、汽车电子等领域占据主流。启用 PSRAM 后 QPS 提升明显。STM32 配合以太网或硬件协议栈，预期性能更高。并发建议控制在 6 以内，过高会导致底层 lwIP 协议栈丢包。几乎是一套 API，让桌面端、云