别再死记公式了！用Python代码直观理解多重集排列（附完整代码示例）

??yy

380人浏览 · 2026-06-03 09:16:25

??yy · 2026-06-03 09:16:25 发布

用Python玩转多重集排列：从数学公式到动态可视化

在准备技术面试或研究算法问题时，你是否曾被多重集排列的数学公式困扰？那些带着阶乘和除法的复杂表达式，往往让人望而生畏。但作为一名Python开发者，我们完全可以用更直观的方式理解这个概念——通过代码实现和可视化展示。

1. 多重集排列的核心概念

多重集（Multiset）是数学中一种允许元素重复出现的集合结构。与普通集合不同，多重集中的每个元素都有一个 重复度 （multiplicity），表示该元素出现的次数。例如，多重集S = {a, a, b, c, c, c}可以表示为S = {2·a, 1·b, 3·c}。

多重集排列的核心问题是：**给定一个多重集，从中选取r个元素进行排列，有多少种不同的排列方式？**这个问题的答案取决于选取方式：

全排列 ：当r等于多重集中所有元素的总数时
非全排列 ：当r小于多重集中元素总数时

from collections import Counter

def is_multiset(items):
    """检查一个序列是否是多重集"""
    return any(count > 1 for count in Counter(items).values())

# 示例
print(is_multiset(['a', 'a', 'b']))  # True
print(is_multiset(['a', 'b', 'c']))  # False

2. 全排列的Python实现与验证

多重集全排列的数学公式为：

N = n! / (n₁! × n₂! × ... × nₖ!)

其中n是所有元素的总数，nᵢ是第i种元素的重复度。

让我们用Python实现这个计算：

import math

def multiset_full_permutations(multiset):
    """
    计算多重集全排列的数量
    
    参数:
        multiset: 多重集的元素列表，如['a','a','b','c','c','c']
    
    返回:
        全排列的数量
    """
    counter = Counter(multiset)
    total = len(multiset)
    denominator = 1
    for count in counter.values():
        denominator *= math.factorial(count)
    return math.factorial(total) // denominator

# 验证书中的例子
S = ['a']*3 + ['b']*2 + ['c']*1
print(multiset_full_permutations(S))  # 输出60，与数学计算结果一致

为了更直观地理解这个公式，我们可以 生成所有实际的全排列 进行验证：

from itertools import permutations

def generate_unique_permutations(multiset):
    """生成多重集的所有唯一全排列"""
    unique_perms = set(permutations(multiset))
    return list(unique_perms)

# 示例
perms = generate_unique_permutations(['a', 'a', 'b'])
print(perms)  # [('a', 'a', 'b'), ('a', 'b', 'a'), ('b', 'a', 'a')]
print(len(perms))  # 3，与3!/(2!1!)=3一致

3. 非全排列的两种情况与实现

多重集的非全排列分为两种情况，处理方式完全不同：

3.1 所有元素重复度都大于等于r

这种情况下，排列数为kʳ，其中k是不同元素的种类数。

def multiset_permutations_case1(elements, r):
    """
    情况1：所有元素的重复度都≥r时的排列数计算
    
    参数:
        elements: 多重集的元素列表
        r: 要选取的元素个数
    
    返回:
        排列数量
    """
    k = len(set(elements))
    return k ** r

# 示例：S = {a, a, b, b, c, c}, r=2
print(multiset_permutations_case1(['a','a','b','b','c','c'], 2))  # 3²=9

3.2 某些元素重复度小于r

这种情况下没有简单公式，但我们可以用包含-排除原理或生成所有唯一排列：

from itertools import product

def multiset_permutations_case2(multiset, r):
    """
    情况2：某些元素重复度<r时的排列生成
    
    参数:
        multiset: 多重集的元素列表
        r: 要选取的元素个数
    
    返回:
        所有唯一的r排列列表
    """
    counter = Counter(multiset)
    unique_elements = list(counter.keys())
    
    # 生成所有可能的r元组
    all_tuples = product(unique_elements, repeat=r)
    
    # 筛选出符合重复度限制的排列
    valid_perms = []
    for t in all_tuples:
        temp_counter = Counter(t)
        valid = True
        for elem, count in temp_counter.items():
            if count > counter[elem]:
                valid = False
                break
        if valid:
            valid_perms.append(t)
    
    return valid_perms

# 示例：S = {a, a, b, c}, r=3
perms = multiset_permutations_case2(['a','a','b','c'], 3)
print(perms)  # 包含所有符合条件的3排列
print(len(perms))  # 排列数量

4. 可视化多重集排列的动态变化

为了更直观地理解重复度如何影响排列数量，我们可以创建一个动态可视化：

import matplotlib.pyplot as plt
import numpy as np

def visualize_permutation_growth(element_counts, max_r):
    """
    可视化随着r增加，排列数量的变化
    
    参数:
        element_counts: 各元素的重复度字典，如{'a':3, 'b':2}
        max_r: 要展示的最大r值
    """
    r_values = range(1, max_r+1)
    counts = []
    
    for r in r_values:
        multiset = []
        for elem, cnt in element_counts.items():
            multiset.extend([elem]*cnt)
        
        if all(r <= cnt for cnt in element_counts.values()):
            # 情况1
            count = len(element_counts) ** r
        else:
            # 情况2
            perms = multiset_permutations_case2(multiset, r)
            count = len(perms)
        
        counts.append(count)
    
    plt.figure(figsize=(10,6))
    plt.plot(r_values, counts, 'bo-')
    plt.xlabel('排列长度 r')
    plt.ylabel('唯一排列数量')
    plt.title('多重集排列数量随r的变化\n元素重复度: '+str(element_counts))
    plt.grid(True)
    plt.show()

# 示例可视化
visualize_permutation_growth({'a':3, 'b':2}, 5)

这个可视化会显示随着r的增加，排列数量如何变化。当r小于所有元素的重复度时，曲线呈指数增长；当r超过某些元素的重复度时，增长模式会发生变化。

5. 实际应用案例

多重集排列在实际中有广泛的应用，特别是在以下场景：

密码学 ：分析密码的可能组合
生物信息学 ：DNA序列分析
游戏开发 ：道具组合计算
数据分析 ：统计特定事件序列

例如，在游戏开发中，玩家可能有多个相同类型的道具：

# 玩家道具：3把剑，2瓶药水，1个护盾
items = ['sword']*3 + ['potion']*2 + ['shield']*1

# 计算使用2个道具的所有可能顺序
combinations = multiset_permutations_case2(items, 2)
print(f"玩家使用2个道具有{len(combinations)}种可能顺序:")
print(combinations)

6. 性能优化与进阶技巧

当处理大规模多重集时，生成所有排列可能不现实。这时可以使用数学方法或优化算法：

from functools import reduce
from operator import mul

def count_multiset_permutations(element_counts, r):
    """
    高效计算多重集排列数量（不生成实际排列）
    
    参数:
        element_counts: 元素到重复度的字典
        r: 排列长度
    
    返回:
        排列数量
    """
    k = len(element_counts)
    total_elements = sum(element_counts.values())
    
    if r == total_elements:
        # 全排列情况
        numerator = math.factorial(total_elements)
        denominator = reduce(mul, [math.factorial(c) for c in element_counts.values()], 1)
        return numerator // denominator
    elif all(r <= c for c in element_counts.values()):
        # 情况1
        return k ** r
    else:
        # 情况2，使用包含-排除原理
        # 这里简化处理，实际实现会更复杂
        unique_perms = set(permutations(generate_multiset(element_counts), r))
        return len(unique_perms)

def generate_multiset(element_counts):
    """根据元素计数生成多重集列表"""
    return [elem for elem, cnt in element_counts.items() for _ in range(cnt)]

对于特别大的问题，可以考虑使用 动态规划 或 生成函数 等高级方法，这些方法可以避免显式生成所有排列。

理解多重集排列不仅有助于解决算法问题，还能培养对组合数学的直觉。通过Python实现，我们把抽象的数学概念转化为了可以交互、验证和可视化的具体代码，这正是计算思维的核心所在。

亚马逊云科技技术品牌专区

更多推荐

Google Search Console AI Performance Reports：企业如何追踪 AI Overview 和 AI Mode 可见性

亚马逊云科技技术品牌专区

2026会计专业学数据分析的价值

例如，可以在数据分析、数据科学等领域担任更高级别的职位，拓展自己的职业发展空间。通过 CDA 认证的学习和考试，可以系统地掌握数据分析的知识和技能，提升自己在数据分析方面的能力。CDA 认证可以证明他们具备扎实的数据分析能力和专业素养，增强他们在人工智能、大数据分析、金融等领域的就业竞争力。平衡会计专业知识与数据分析技能的学习难度较大，可以优先掌握与财务直接相关的分析工具（如Excel和Power