【python】从零实现 AI 桌面宠物：会学习你的习惯的桌面宠物游戏之大更新篇

码来的小朋友

695人浏览 · 2026-06-26 00:09:11

码来的小朋友 · 2026-06-26 00:09:11 发布

接着前一篇文章从零实现一个AI桌面宠物初探这篇文章的续作，这个版本做了大更新，有兴趣的小伙伴可以看一看，源码和游戏链接再文章末尾，自行下载。

从零实现一个AI桌面宠物：纯Python、离线运行、会学习你的习惯

你是否想过拥有一只生活在电脑桌面上的虚拟宠物？它会主动找你玩，会饿会困会开心，能记住你喂过它什么，甚至拥有独立的"性格"——而且这一切完全离线运行，不需要联网，不调用任何云API，全部用纯Python实现。

一、项目背景

市面上的桌面宠物要么是静态壁纸，要么需要联网调用AI接口。我想做一个不一样的：

完全离线 —— 0 API 调用，所有AI逻辑在本地运行
有"大脑" —— 能自主学习主人的互动习惯，拥有独立的性格和记忆
轻量 —— 一个普通笔记本就能跑，RNN模型仅28K参数
零图片资源 —— 宠物完全用代码绘制，不需要任何图片素材

最终成品是一个200×280像素的透明窗口，一只矢量风格的卡通猫会"住"在你的桌面上。

二、最终效果

请添加图片描述

功能	操作方式
左键单击宠物	随机互动，宠物切换对应表情
左键拖拽	移动宠物位置
右键单击宠物	弹出功能菜单，宠物即时反馈表情
系统托盘图标	置顶切换 / 菜单操作

右键菜单功能（每个操作宠物都会呈现不同的动画表情和叠加特效）：

打招呼 — 开心/好奇/活泼地回应
摸摸头 — 开心眯眼/好奇张望/犯困，爱心特效
称赞 — 兴奋/开心，星星特效
喂食 — 开心/好奇地闻食物，食物特效
送礼物 — 兴奋/开心，消耗金币，礼物盒特效
洗澡 — 开心/活泼，泡泡特效
治疗 — 恢复健康，安逸舒适，闪光特效
玩耍 — 活泼蹦跳/开心追逐，毛线球特效
跳舞 — 跳舞动画/兴奋，星星特效
讲故事 — 好奇/开心/犯困，书本特效
教本领 — 好奇/活泼，闪光特效
生气 — 伤心/委屈，愤怒特效
改名字 — 自定义宠物名称
查看状态 — 弹出窗口显示四维属性进度条

宠物会随时间自动衰减属性，并自主学习在什么时候应该做什么。每个互动都会触发即时视觉反馈，让你立刻知道它的"心情"。

三、技术架构

整体设计

用户互动 → 性格系统 → 行为引擎 → 动作输出
                  ↘ 记忆系统 ↗
对话 ← 混合引擎（模板 + Char-RNN）

技术选型

组件	技术	选型原因
桌面窗口	PyQt5	原生透明窗口、系统托盘、事件处理
游戏渲染	pygame-ce	高效的2D图形API，支持SRCALPHA合成
神经网络	numpy	纯手工实现Char-RNN，零ML框架依赖
行为决策	Q-Learning	轻量级强化学习，可解释性强

四、核心实现详解

4.1 矢量风格宠物绘制（非像素）

这是项目的最大亮点之一。宠物不是像素画，而是用代码绘制的矢量风格卡通猫。

实现文件：renderer/sprites.py

核心思路：用一个 _draw_cat_base 函数绘制猫的全部身体，通过 modifiers 字典驱动所有动画状态：

def _draw_cat_base(surf, frame, modifiers):
    # modifiers 控制所有变形参数:
    #   bounce_y    — 垂直弹跳（开心时）
    #   head_tilt   — 头部倾斜（好奇时）
    #   tail_up     — 尾巴抬起（玩耍时）
    #   eye_open    — 眼睛睁开程度（0~1.4）
    #   smile       — 嘴角弧度（正=笑，负=哭）
    #   blush       — 腮红透明度
    #   body_color  — 身体颜色（生病时变灰）
    
    breathe = math.sin(frame * 0.3) * 1.5  # 呼吸动画
    ear_twitch = math.sin(frame * 0.5) * 2  # 耳朵抖动
    
    # 用 pygame 图元组合成一只猫：
    # 椭圆 → 身体/腿
    # 圆   → 头/尾巴尖
    # 多边形 → 耳朵/鼻子
    # 弧线 → 眼睛/嘴巴
    # 抗锯齿线 → 胡须/尾巴
    # 半透明面 → 腮红

11种情绪状态各自定义一组 modifiers 参数：

状态	关键动画	实现方式
idle	呼吸起伏	sin波驱动body垂直微动
happy	上下弹跳	bounce_y = abs(sin(frame0.5))6
sad	垂头丧气	head_tilt 负值 + 半闭眼
playful	活泼好动	高弹跳 + 尾巴竖起 + 踢腿
hungry	左右张望	head_tilt 正弦摆动 + 张嘴
sleepy	打瞌睡	eye_open=0.1 + 缓慢点头
sick	生病萎靡	body_color换为灰白色
curious	好奇歪头	head_tilt 摆动 + 睁大眼
excited	兴奋蹦跳	高弹跳 + 举双爪 + 快速踢腿
cuddly	撒娇求抱	倾斜歪头 + 伸爪 + 腮红
dance	左右摇摆	交替抬爪 + 左右 sway

技术要点：腮红效果通过单独创建带逐像素Alpha的Surface实现：

blush_surf = pygame.Surface((12, 8), pygame.SRCALPHA)
pygame.draw.ellipse(blush_surf, (255, 184, 184, 120), (0, 0, 12, 8))

4.2 右键交互菜单

实现文件：desktop/pet_window.py

右键菜单的完整流程：

PyQt5检测到 Qt.RightButton 鼠标事件
调用 _show_context_menu(globalPos)
动态创建一个 QMenu，添加7个功能项 + 1个退出项
菜单采用深色主题样式：
- 背景 #2D2D36，选中色 #FF9F43（橙色）
- 圆角边框，完美融入桌面
点击菜单项触发对应操作：
- greet / feed / pet / play / heal → 调用 brain.interact()
- rename → 弹出 QInputDialog 改名字
- status → 弹窗显示四维属性数值

关键代码片段：

def _show_context_menu(self, global_pos):
    menu = QMenu(self)
    menu.setStyleSheet("""
        QMenu {
            background-color: #2D2D36;
            color: white;
            border: 1px solid #555;
            border-radius: 6px;
            padding: 4px;
        }
        QMenu::item {
            padding: 6px 24px;
            border-radius: 4px;
        }
        QMenu::item:selected {
            background-color: #FF9F43;
        }
    """)
    
    actions = [
        ("打招呼", "greet"), ("摸摸头", "pet"), ("称赞", "praise"),
        ("喂食", "feed"), ("送礼物", "gift"), ("洗澡", "bathe"),
        ("治疗", "heal"), ("玩耍", "play"), ("跳舞", "dance"),
        ("讲故事", "story"), ("教本领", "teach"),
    ]
    for label, action_type in actions:
        action = QAction(label, self)
        action.triggered.connect(lambda checked, t=action_type: self.on_menu_action(t))
        menu.addAction(action)
    
    menu.addSeparator()
    scold_action = QAction("生气", self)
    scold_action.triggered.connect(lambda: self.on_menu_action("scold"))
    menu.addAction(scold_action)
    
    menu.addSeparator()
    shop_action = QAction("🛒商店", self)
    shop_action.triggered.connect(self.open_shop)
    menu.addAction(shop_action)
    rename_action = QAction("改名字", self)
    rename_action.triggered.connect(lambda: self.on_menu_action("rename"))
    menu.addAction(rename_action)
    status_action = QAction("查看状态", self)
    status_action.triggered.connect(lambda: self.on_menu_action("status"))
    menu.addAction(status_action)
    
    menu.addSeparator()
    exit_action = QAction("退出", self)
    exit_action.triggered.connect(self.quit_application)
    menu.addAction(exit_action)
    
    menu.exec_(global_pos)

4.3 PyGame嵌入Qt窗口

这是一个关键的架构决策。最终方案是PyGame只作渲染引擎，Qt负责窗口管理：

class PetWindow(QWidget):
    def _setup_pygame(self):
        pygame.font.init()
        self.pygame_surf = pygame.Surface((WINDOW_WIDTH, WINDOW_HEIGHT), pygame.SRCALPHA)
    
    def paintEvent(self, event):
        painter = QPainter(self)
        pixels = pygame.image.tobytes(self.pygame_surf, "RGBA")
        image = QImage(pixels, w, h, QImage.Format_RGBA8888)
        painter.drawImage(0, 0, image)
    
    def _update(self):
        self.brain.tick()
        self.renderer.render(self.pygame_surf, self.brain.current_emotion, dialogue)
        self.update()  # 触发 paintEvent

每次tick：brain更新状态 → renderer绘制到pygame surface → paintEvent将surface转为QImage显示。这样既享受了pygame的绘图API，又获得了Qt的窗口管理能力。

4.4 Q-Learning 行为引擎（详细设计）

宠物拥有一个轻量级的强化学习"大脑"，核心是状态离散化 + Q表查询 + 奖励驱动更新。

状态空间设计

5 维连续属性通过 discretize() 映射到 3 级离散值：

def discretize(value: float, levels: int = 3) -> int:
    return min(levels - 1, max(0, int(value * levels / 100)))

维度	范围	0（低）	1（中）	2（高）
饥饿度	0-100	<33	33-66	>66
精力值	0-100	<33	33-66	>66
心情值	0-100	<33	33-66	>66
健康值	0-100	<33	33-66	>66
时间段	0-23	0-7(早)	8-17(中)	18-23(晚)

总状态数：3 × 3 × 3 × 3 × 3 = 243 种

动作空间（7 种）

ACTIONS = ["sleep", "play", "explore", "cuddle", "eat", "wander", "groom"]

Q 表结构

Q 表用字典实现，以状态元组为 key，每个 key 存 7 个动作的 Q 值：

# 状态 (hunger_lv, energy_lv, mood_lv, health_lv, period)
state = (2, 1, 0, 1, 1)

# Q 值示例
q_table[state] = {
    "sleep":   0.32,
    "play":    0.15,
    "explore": 0.28,
    "cuddle":  0.41,
    "eat":     0.73,
    "wander":  0.19,
    "groom":   0.22,
}

未访问过的新状态自动初始化为 random.uniform(0, 0.1)。

动作选择策略

def choose_action(self, hunger, energy, mood, health, hour):
    state = self._state_key(hunger, energy, mood, health, hour)
    q_vals = self._get_q_values(state)

    # ε-greedy：20% 随机探索，80% 利用经验
    if random.random() < self.exploration_rate:
        return random.choice(ACTIONS)
    return max(q_vals, key=q_vals.get)

探索率初始 0.2，每次更新乘以 0.9995，最低 0.05。约 3000 次更新后降至 0.1。

奖励函数（完整）

def get_reward(self, action, hunger, energy, mood, health):
    reward = 0.0
    p = self.personality

    if action == "eat":
        reward += 1.0 if hunger > 50 else -0.5       # 饿了吃 → 正奖励
        if p: reward += p.get("affectionate") * 0.2   # 亲昵的猫更爱被喂

    elif action == "play":
        reward += 1.0 if energy > 40 else -1.0        # 有精力才玩
        reward += 0.5 if mood < 50 else 0.2           # 心情不好更需要玩
        if p:
            reward += p.get("energetic") * 0.5         # 活泼的猫爱玩
            reward += p.get("curious") * 0.3            # 好奇的猫爱玩

    elif action == "sleep":
        reward += 1.0 if energy < 40 else -0.3        # 累了才睡
        if p: reward -= p.get("energetic") * 0.3       # 活泼的猫不爱睡

    elif action == "cuddle":
        reward += 0.5 if mood < 60 else 0.2           # 心情差时求抱
        if p:
            reward += p.get("affectionate") * 0.5      # 亲昵的猫爱撒娇
            reward += p.get("clingy") * 0.3             # 粘人的猫爱撒娇

    elif action == "explore":
        reward += 0.5 if energy > 50 else -0.5        # 有精力才探索
        if p: reward += p.get("curious") * 0.6         # 好奇心驱动

    elif action == "wander":
        reward += 0.2                                   # 保底正奖励
        if p:
            reward += p.get("curious") * 0.2
            reward += p.get("energetic") * 0.1

    elif action == "groom":
        reward += 0.3 if health < 50 else 0.1         # 不健康时更需要
        if p: reward += p.get("stubborn") * -0.1       # 固执的不爱打理

    return reward

Q 值更新公式

标准 Q-Learning 更新：

Q(s, a) += α × [r + γ × max Q(s', a') - Q(s, a)]

对应代码：

current_q = q_vals[action]
max_next_q = max(next_q_vals.values())
new_q = current_q + LEARNING_RATE * (reward + DISCOUNT_FACTOR * max_next_q - current_q)
q_vals[action] = new_q

参数	值	说明
α（Learning Rate）	0.1	每次更新的步长
γ（Discount Factor）	0.9	对未来奖励的重视程度
ε（Exploration Rate）	0.2→0.05	探索概率（指数衰减）

自主行为循环

每 15 秒触发一次 _autonomous_action()：

读取当前四维属性 + 当前小时
choose_action() → 选择行为
执行行为 → 改变属性 → 获得 reward
update() → 更新 Q 表
探索率衰减：ε *= 0.9995

最终宠物会自然学会：饿了找吃、累了睡觉、无聊了玩耍——完全通过试错，没有任何硬编码规则。

4.5 纯NumPy实现的Char-RNN（完整细节）

这是项目中"最硬核"的部分。一个字符级别的循环神经网络，完全用NumPy手动实现前向传播、反向传播（BPTT）和采样。

网络架构

输入（字符索引）
    ↓
Embedding（vocab_size × embed_dim）
    ↓
单层RNN（embed_dim → hidden_dim）
    ↓
Linear（hidden_dim → vocab_size）
    ↓
Softmax → 输出（下一个字符的概率分布）

前向传播

def forward(self, inputs, h_prev=None):
    T = len(inputs)
    xs = np.zeros((T, self.embed_dim))      # 输入序列
    hs = np.zeros((T + 1, self.hidden_dim))  # 隐状态序列
    hs[0] = h_prev or np.zeros((1, self.hidden_dim))

    for t in range(T):
        xs[t] = self.W_embed[inputs[t]]                         # Embedding 查找
        hs[t+1] = np.tanh(xs[t] @ self.W_xh + hs[t] @ self.W_hh + self.b_h)  # RNN 单元

    ys = hs[1:] @ self.W_hy + self.b_y                           # 输出层
    return xs, hs, ys

损失函数

交叉熵损失（Cross-Entropy Loss）：

# Softmax
probs = np.exp(ys - np.max(ys, axis=1, keepdims=True))
probs /= np.sum(probs, axis=1, keepdims=True)

# Cross-Entropy
loss = -np.sum(np.log(probs[np.arange(T), targets] + 1e-8)) / T

反向传播（BPTT）

沿时间反向传播梯度，核心是链式法则沿时间步展开：

for t in reversed(range(T)):
    dy = probs[t:t+1].copy()
    dy[0, targets[t]] -= 1             # dSoftmax + dCrossEntropy 合并

    # 输出层梯度
    dW_hy += hs[t+1:t+2].T @ dy
    db_y += dy

    # RNN 隐层梯度（沿时间反向传播）
    dh = dy @ self.W_hy.T + dh_next
    dh_raw = (1 - hs[t+1:t+2] ** 2) * dh   # dtanh

    db_h += dh_raw
    dW_hh += hs[t:t+1].T @ dh_raw
    dW_xh += xs[t:t+1].T @ dh_raw
    dW_embed[inputs[t]] += (dh_raw @ self.W_xh.T).reshape(-1)

    dh_next = dh_raw @ self.W_hh.T       # 传递到上一个时间步

参数更新（SGD + 梯度裁剪）

for param, grad in [("W_embed", dW_embed), ("W_xh", dW_xh), ("W_hh", dW_hh),
                    ("b_h", db_h), ("W_hy", dW_hy), ("b_y", db_y)]:
    np.clip(grad, -5, 5, out=grad)              # 梯度裁剪，防止爆炸
    setattr(self, param, getattr(self, param) - lr * grad)  # SGD 更新

文本生成（Temperature 采样）

def sample(self, seed, length=30, temperature=0.8):
    h = np.zeros((1, self.hidden_dim))
    # 用 seed 序列预热隐状态
    for idx in seed_indices:
        emb = self.W_embed[idx].reshape(1, -1)
        h = np.tanh(emb @ self.W_xh + h @ self.W_hh + self.b_h)

    result = seed
    for _ in range(length):
        y = (h @ self.W_hy + self.b_y).reshape(-1) / temperature
        exp_y = np.exp(y - np.max(y))
        probs = exp_y / np.sum(exp_y)
        next_idx = np.random.choice(self.vocab_size, p=probs)  # 按概率采样
        next_char = self.idx_to_char(next_idx)
        if next_char == "\n": break
        result += next_char
    return result

temperature 控制生成随机性：值越低越保守（趋于常见字符），值越高越随机（可能产生新奇的组合）。

模型参数量计算

参数	Shape	参数量
W_embed	70 × 16	1,120
W_xh	16 × 64	1,024
W_hh	64 × 64	4,096
b_h	1 × 64	64
W_hy	64 × 70	4,480
b_y	1 × 70	70
总计		10,854

约 10.8K 参数，加上中间缓存约 28K 参数量。

训练流程

# main.py 首次启动调用
def train(model, epochs=200, lr=0.01):
    lines = load_corpus("corpus.txt")    # 加载语料
    batches = prepare_batch(model, lines) # 分词并编码

    for epoch in range(epochs):
        np.random.shuffle(batches)
        decay_lr = lr * (1 - epoch / epochs)  # 学习率线性衰减

        for batch in batches:
            inputs, targets = batch[:-1], batch[1:]
            loss = model.train_step(inputs, targets, decay_lr)

        # 每 1/3 进度打印一次 loss 和生成样本
        if (epoch + 1) % (epochs // 3) == 0:
            sample = model.sample("", length=15)
            print(f"epoch {epoch+1} loss={avg_loss:.2f} {sample[:20]}")

语料格式：每行一个带标签的句子，如 <happy> I am so happy today!
预处理：添加 <start> / <end> 标记，转为索引序列
训练 200 epoch，loss 从 ~3.1 降至 ~0.59
约 30 秒完成训练（纯 NumPy）

对话时混合策略

80% 概率 → 模板匹配（保证通顺自然，中文预设句子）
20% 概率 → RNN 自由生成（增加惊喜和多样性）

RNN 生成时传入情绪标签作为 seed（如 <happy>），控制输出风格。

4.6 记忆系统与数据持久化

记忆系统设计

记忆采用键值对存储，每条记忆包含三个字段：

{
    "last_food": {
        "time":  1700000000,    # 最后访问的 Unix 时间戳
        "value": "鸡肉",        # 记忆内容（可选）
        "count": 5              # 累计访问次数
    },
    "last_petted": {
        "time":  1700000500,
        "value": None,          # 无具体内容
        "count": 23
    }
}

7天半衰期衰减权重：

def _weight(self, timestamp):
    days = (time.time() - timestamp) / 86400
    return 2.0 ** (-days / 7)

天数	权重
0 天	1.000
1 天	0.905
3 天	0.741
7 天	0.500
14 天	0.250
30 天	0.051

自动清理条件：权重 < 0.05 且 count < 3 → 删除。

数据持久化格式

所有数据存储在 brain_models/data/ 目录，使用 JSON + NPZ 两种格式。

brain_state.json — 宠物状态快照：

{
    "hunger": 30.0,
    "energy": 65.2,
    "mood": 55.0,
    "health": 80.0,
    "name": "小咪"
}

q_table.json — Q-Learning 状态-动作表：

{
    "q_table": {
        "2,1,0,1,1": {
            "sleep": 0.32,
            "play": 0.15,
            "explore": 0.28,
            "cuddle": 0.41,
            "eat": 0.73,
            "wander": 0.19,
            "groom": 0.22
        }
    },
    "exploration_rate": 0.082
}

状态元组 (2,1,0,1,1) 以逗号分隔字符串 "2,1,0,1,1" 作为 JSON key（JSON 不支持 tuple 作为 key）。

memory.json — 记忆数据：

{
    "last_food": {"time": 1700000000, "value": "鸡肉", "count": 5},
    "last_petted": {"time": 1700000500, "value": "被抚摸", "count": 23},
    "name_changed": {"time": 1699900000, "value": "小咪", "count": 1}
}

personality.json — 性格向量：

{
    "dims": {
        "affectionate": 0.65,
        "energetic": 0.52,
        "curious": 0.71,
        "stubborn": 0.28,
        "clingy": 0.43
    },
    "daily_deltas": {
        "affectionate": 0.04,
        "energetic": 0.02,
        "curious": 0.01,
        "stubborn": 0.0,
        "clingy": 0.03
    },
    "last_date": "2026-06-25"
}

daily_deltas 记录当日累计变化量，用于限制每日总变化不超过 ±0.1。
last_date 用于跨日重置累计变化量。

weights.npz — Char-RNN 权重（NumPy 压缩格式）：

np.savez_compressed(path,
    W_embed=...,   # (70, 16)
    W_xh=...,      # (16, 64)
    W_hh=...,      # (64, 64)
    b_h=...,       # (1, 64)
    W_hy=...,      # (64, 70)
    b_y=...,       # (1, 70)
)

使用 np.savez_compressed 自动压缩，约 112KB。

保存与加载时机

事件	保存	加载
程序启动	—	✅ 加载所有数据
退出	✅	—
每 tick	自动实时写内存	—

4.7 互动响应情绪系统

宠物在接收到用户操作时，立即切换画面表情，给用户即时的视觉反馈。

实现原理（pet/brain.py），每个操作还附带金币奖励和叠加特效：

def interact(self, action_type: str) -> str:
    self.memory.remember(f"last_{action_type}")
    self.emotion_timer = FPS * 3  # 情绪保持3秒
    self.coins += COIN_REWARDS.get(action_type, 0)  # 互动赚金币

    if action_type == "pet":
        self.mood = min(100, self.mood + PET_PET_MOOD)
        self.personality.modify({"affectionate": 0.02, "clingy": 0.01})
        self._set_overlay("heart")  # 爱心特效
        self.current_emotion, self.current_action = self._pick_emotion([
            ("happy", "happy", 5),    # 50% 概率开心
            ("curious", "curious", 2), # 30% 概率好奇
            ("sleepy", "sleepy", 1),  # 20% 概率犯困
        ])
        return self.dialogue.generate("loving")

每个操作对应多种可能的情绪反馈，使用加权随机选择：

操作	可能情绪（权重）
摸摸头	happy(5) / curious(2) / sleepy(1)
喂食	happy(5) / curious(3) / playful(1)
玩耍	playful(5) / happy(3) / curious(2)
治疗	happy(5) / idle(2) / sleepy(1)
打招呼	happy(5) / curious(3) / playful(2)
洗澡	happy(5) / playful(3) / curious(1)
送礼物	excited(5) / happy(3) / playful(1)
称赞	excited(5) / happy(3) / cuddly(1)
讲故事	curious(5) / happy(2) / sleepy(2)
教本领	curious(4) / playful(3) / happy(2)
跳舞	dance(5) / excited(3) / happy(1)
生气	sad(5) / sleepy(2) / idle(1)

情绪切换后持续约3秒（emotion_timer），然后自动恢复为由属性数值决定的基础情绪。这样既保证了操作的即时反馈，又不影响宠物自主行为的连贯性。

tick() 中的关键逻辑：

def tick(self):
    # ... 属性衰减 ...
    if self.emotion_timer > 0:
        self.emotion_timer -= 1  # 持续显示互动情绪
    else:
        self.current_emotion = self._determine_emotion()  # 恢复自动判断

此外，查看状态不再弹出独立窗口，而是显示在宠物的对话气泡中，停留6秒：

elif action_type == "status":
    text = "饥饿：30/100  精力：70/100  心情：60/100  健康：80/100"
    self._show_dialogue(text, duration=FPS * 6)  # 6秒停留

4.8 互动视觉叠加特效

为了让每次互动更有"感觉"，我实现了一个特效叠加系统。每个互动操作会触发对应的视觉特效，在宠物身上叠加显示2-3秒。

实现方式是在 renderer/sprites.py 中定义一系列 draw_xxx_overlay(surf, frame, progress) 函数，其中 progress 从 0→1 控制动画进度：

OVERLAY_FUNCTIONS = {
    "food": draw_food_overlay,      # 小鱼干掉落
    "heart": draw_heart_overlay,    # 爱心飘散
    "gift": draw_gift_overlay,      # 礼物盒弹跳
    "toy": draw_toy_overlay,        # 毛线球滚动
    "star": draw_star_overlay,      # 星星旋转上升
    "bubble": draw_bubble_overlay,  # 泡泡飘散
    "book": draw_book_overlay,      # 书本翻开
    "anger": draw_anger_overlay,    # 愤怒爆炸
    "sparkle": draw_sparkle_overlay,# 菱形闪光
}

特效与宠物的情绪动画同时渲染，在 brain 中通过 _set_overlay() 控制：

def _set_overlay(self, overlay_type: str, duration: int = None):
    self.visual_overlay = overlay_type
    dur = duration or FPS * 2        # 默认2秒
    self.overlay_duration = dur
    self.overlay_max_duration = dur

然后在渲染循环中计算 progress = 1.0 - (overlay_duration / overlay_max_duration)，传入 overlay 函数实现平滑动画。

五、遇到的坑与解决方案

1. Pygame-ce字体初始化崩溃

问题：Python 3.14 + pygame-ce 2.5.7 下，调用 pygame.font.SysFont() 会触发Windows字体枚举，但是枚举返回的数据类型与Python 3.14不兼容，导致 splitext 报错 TypeError: expected str, not int。

解决：放弃使用 SysFont，改为直接加载Windows字体目录下的具体字体文件：

def _find_chinese_font():
    paths = [
        "C:\\Windows\\Fonts\\simsun.ttc",
        "C:\\Windows\\Fonts\\msyh.ttc",
        "C:\\Windows\\Fonts\\simhei.ttf",
    ]
    for p in paths:
        if os.path.exists(p):
            return pygame.font.Font(p, 14)
    return pygame.font.Font(None, 16)  # 最后兜底

2. RNN训练速度过慢

问题：原始实现中，get_loss方法先调用forward进行前向传播，然后在反向传播中又重复计算了部分前向值，导致每个训练step做了2次前向传播。

解决：重写train_step方法，将前向传播和反向传播合并为一个函数，复用前向计算的结果，训练速度提升了约10倍（200 epoch从>2分钟缩短至约30秒）。

3. 透明窗口的事件穿透

问题：Qt透明窗口默认会让鼠标事件穿透到下层窗口，但我们需要在宠物身上捕获点击。

解决：不设置 WA_TransparentForMouseEvents，在 mousePressEvent 中通过 _is_on_pet() 判断点击位置是否在宠物的渲染矩形内，仅在矩形内处理事件。

六、如何使用

环境要求

Python 3.14+
依赖：pygame-ce, PyQt5, numpy

安装运行

pip install pygame-ce PyQt5 numpy
cd ai_pet
python main.py

或双击 run.bat。

首次启动会自动训练Char-RNN（约30秒），之后秒开。所有数据保存在 brain_models/data/ 目录，退出时自动保存。

七、项目结构

ai_pet/
├── main.py                      # 程序入口
├── config.py                    # 全局配置参数
│
├── pet/                         # AI 大脑模块
│   ├── brain.py                 # 大脑主控
│   ├── behavior.py              # Q-Learning 行为引擎
│   ├── personality.py           # 5维性格系统
│   ├── memory.py                # 记忆系统
│   └── dialogue.py              # 混合对话引擎
│
├── brain_models/                # 神经网络模块
│   ├── char_rnn.py              # 微型 Char-RNN
│   ├── train.py                 # 训练脚本
│   └── data/                    # 数据持久化
│       ├── brain_state.json
│       ├── q_table.json
│       ├── memory.json
│       ├── personality.json
│       ├── corpus.txt           # 训练语料
│       └── weights.npz          # 训练好的权重
│
├── renderer/                    # 渲染模块
│   ├── sprites.py               # 矢量精灵绘制 + 叠加特效
│   └── renderer.py              # 帧动画 + 对话气泡
│
├── desktop/                     # 桌面集成模块
│   ├── pet_window.py            # 透明穿透窗口 + 右键菜单
│   └── tray.py                  # 系统托盘
│
├── AIPet.spec                   # PyInstaller 打包配置
└── assets/                      # 资源目录

八、技术栈总结

组件	技术	用途
游戏循环/渲染	pygame-ce	矢量绘图、帧动画
桌面窗口	PyQt5	透明窗口、系统托盘、右键菜单
神经网络	numpy	Char-RNN 训练与推理
行为决策	Q-Learning	状态-动作价值学习
数据格式	JSON + NPZ	配置/状态持久化

九、总结与展望

这个项目用纯Python实现了一个完整的AI桌面宠物系统，核心亮点在于：

零依赖AI —— RNN完全用NumPy手写，不依赖PyTorch/TensorFlow
零图片资源 —— 矢量风格绘图，全部用代码生成
零联网 —— 所有功能离线运行
可成长 —— Q-Learning让宠物越养越"懂你"

目前已经实现的扩展：

15种互动操作（含跳舞、讲故事、教本领等）
9种互动视觉特效

未来可以继续扩展的方向：

更多互动小游戏（接球、拼图）
多宠物同屏互动
声音反馈系统
自定义外观编辑器

项目完全开源，代码放在 GitHub。如果你也对桌面宠物或轻量AI感兴趣，欢迎Star和PR！
游戏源代码下载链接
 游戏源码和游戏运行程序下载，可看公众号这篇文章

可以关注博主公众号：码来的小朋友

如果你觉得这篇文章对你有帮助，欢迎点赞、收藏、转发，让更多人看到用纯Python也能做出这么有趣的AI应用！

亚马逊云科技技术品牌专区

更多推荐

TonY与YARN集成原理：深度学习任务的资源调度与隔离机制

TonY是一个能让深度学习框架原生运行在Apache Hadoop上的框架，它通过与YARN的深度集成，实现了对深度学习任务的高效资源调度与隔离。本文将深入解析TonY与YARN集成的核心原理，帮助读者理解如何在Hadoop集群上稳定运行大规模深度学习任务。## 一、TonY与YARN集成的架构设计 🚀TonY与YARN的集成架构主要由**TonyClient**、**Resource

亚马逊云科技技术品牌专区

2026年麒麟KYCP云计算认证深度解析：高级信创云人才的能力标尺

麒麟KYCP云计算是信创云平台高级运维认证，由工信部与麒麟软件联合颁发，聚焦KVM虚拟化、Kubernetes编排及信创云安全架构。考试含100题（单选70+多选20+判断10），90分钟需达70分合格，较初级KYCA难度显著提升。持证者可胜任政企信创云架构师等岗位，契合2026年信创规模化落地的人才缺口。备考建议分四阶段：基础巩固（1周）、K8s进阶（2-3周）、安全强化（1周）及模拟冲刺，需重