接着前一篇文章从零实现一个AI桌面宠物初探这篇文章的续作,这个版本做了大更新,有兴趣的小伙伴可以看一看,源码和游戏链接再文章末尾,自行下载。

从零实现一个AI桌面宠物:纯Python、离线运行、会学习你的习惯

你是否想过拥有一只生活在电脑桌面上的虚拟宠物?它会主动找你玩,会饿会困会开心,能记住你喂过它什么,甚至拥有独立的"性格"——而且这一切完全离线运行,不需要联网,不调用任何云API,全部用纯Python实现。


一、项目背景

市面上的桌面宠物要么是静态壁纸,要么需要联网调用AI接口。我想做一个不一样的:

  • 完全离线 —— 0 API 调用,所有AI逻辑在本地运行
  • 有"大脑" —— 能自主学习主人的互动习惯,拥有独立的性格和记忆
  • 轻量 —— 一个普通笔记本就能跑,RNN模型仅28K参数
  • 零图片资源 —— 宠物完全用代码绘制,不需要任何图片素材

最终成品是一个200×280像素的透明窗口,一只矢量风格的卡通猫会"住"在你的桌面上。


二、最终效果

请添加图片描述 请添加图片描述
请添加图片描述 请添加图片描述

功能 操作方式
左键单击宠物 随机互动,宠物切换对应表情
左键拖拽 移动宠物位置
右键单击宠物 弹出功能菜单,宠物即时反馈表情
系统托盘图标 置顶切换 / 菜单操作

右键菜单功能(每个操作宠物都会呈现不同的动画表情和叠加特效):

  • 打招呼 — 开心/好奇/活泼地回应
  • 摸摸头 — 开心眯眼/好奇张望/犯困,爱心特效
  • 称赞 — 兴奋/开心,星星特效
  • 喂食 — 开心/好奇地闻食物,食物特效
  • 送礼物 — 兴奋/开心,消耗金币,礼物盒特效
  • 洗澡 — 开心/活泼,泡泡特效
  • 治疗 — 恢复健康,安逸舒适,闪光特效
  • 玩耍 — 活泼蹦跳/开心追逐,毛线球特效
  • 跳舞 — 跳舞动画/兴奋,星星特效
  • 讲故事 — 好奇/开心/犯困,书本特效
  • 教本领 — 好奇/活泼,闪光特效
  • 生气 — 伤心/委屈,愤怒特效
  • 改名字 — 自定义宠物名称
  • 查看状态 — 弹出窗口显示四维属性进度条

宠物会随时间自动衰减属性,并自主学习在什么时候应该做什么。每个互动都会触发即时视觉反馈,让你立刻知道它的"心情"。


三、技术架构

整体设计

用户互动 → 性格系统 → 行为引擎 → 动作输出
                  ↘ 记忆系统 ↗
对话 ← 混合引擎(模板 + Char-RNN)

技术选型

组件 技术 选型原因
桌面窗口 PyQt5 原生透明窗口、系统托盘、事件处理
游戏渲染 pygame-ce 高效的2D图形API,支持SRCALPHA合成
神经网络 numpy 纯手工实现Char-RNN,零ML框架依赖
行为决策 Q-Learning 轻量级强化学习,可解释性强

四、核心实现详解

4.1 矢量风格宠物绘制(非像素)

这是项目的最大亮点之一。宠物不是像素画,而是用代码绘制的矢量风格卡通猫。

实现文件:renderer/sprites.py

核心思路:用一个 _draw_cat_base 函数绘制猫的全部身体,通过 modifiers 字典驱动所有动画状态:

def _draw_cat_base(surf, frame, modifiers):
    # modifiers 控制所有变形参数:
    #   bounce_y    — 垂直弹跳(开心时)
    #   head_tilt   — 头部倾斜(好奇时)
    #   tail_up     — 尾巴抬起(玩耍时)
    #   eye_open    — 眼睛睁开程度(0~1.4)
    #   smile       — 嘴角弧度(正=笑,负=哭)
    #   blush       — 腮红透明度
    #   body_color  — 身体颜色(生病时变灰)
    
    breathe = math.sin(frame * 0.3) * 1.5  # 呼吸动画
    ear_twitch = math.sin(frame * 0.5) * 2  # 耳朵抖动
    
    # 用 pygame 图元组合成一只猫:
    # 椭圆 → 身体/腿
    # 圆   → 头/尾巴尖
    # 多边形 → 耳朵/鼻子
    # 弧线 → 眼睛/嘴巴
    # 抗锯齿线 → 胡须/尾巴
    # 半透明面 → 腮红

11种情绪状态各自定义一组 modifiers 参数:

状态 关键动画 实现方式
idle 呼吸起伏 sin波驱动body垂直微动
happy 上下弹跳 bounce_y = abs(sin(frame*0.5))*6
sad 垂头丧气 head_tilt 负值 + 半闭眼
playful 活泼好动 高弹跳 + 尾巴竖起 + 踢腿
hungry 左右张望 head_tilt 正弦摆动 + 张嘴
sleepy 打瞌睡 eye_open=0.1 + 缓慢点头
sick 生病萎靡 body_color换为灰白色
curious 好奇歪头 head_tilt 摆动 + 睁大眼
excited 兴奋蹦跳 高弹跳 + 举双爪 + 快速踢腿
cuddly 撒娇求抱 倾斜歪头 + 伸爪 + 腮红
dance 左右摇摆 交替抬爪 + 左右 sway

技术要点:腮红效果通过单独创建带逐像素Alpha的Surface实现:

blush_surf = pygame.Surface((12, 8), pygame.SRCALPHA)
pygame.draw.ellipse(blush_surf, (255, 184, 184, 120), (0, 0, 12, 8))

4.2 右键交互菜单

实现文件:desktop/pet_window.py

右键菜单的完整流程:

  1. PyQt5检测到 Qt.RightButton 鼠标事件
  2. 调用 _show_context_menu(globalPos)
  3. 动态创建一个 QMenu,添加7个功能项 + 1个退出项
  4. 菜单采用深色主题样式:
    • 背景 #2D2D36,选中色 #FF9F43(橙色)
    • 圆角边框,完美融入桌面
  5. 点击菜单项触发对应操作:
    • greet / feed / pet / play / heal → 调用 brain.interact()
    • rename → 弹出 QInputDialog 改名字
    • status → 弹窗显示四维属性数值

关键代码片段:

def _show_context_menu(self, global_pos):
    menu = QMenu(self)
    menu.setStyleSheet("""
        QMenu {
            background-color: #2D2D36;
            color: white;
            border: 1px solid #555;
            border-radius: 6px;
            padding: 4px;
        }
        QMenu::item {
            padding: 6px 24px;
            border-radius: 4px;
        }
        QMenu::item:selected {
            background-color: #FF9F43;
        }
    """)
    
    actions = [
        ("打招呼", "greet"), ("摸摸头", "pet"), ("称赞", "praise"),
        ("喂食", "feed"), ("送礼物", "gift"), ("洗澡", "bathe"),
        ("治疗", "heal"), ("玩耍", "play"), ("跳舞", "dance"),
        ("讲故事", "story"), ("教本领", "teach"),
    ]
    for label, action_type in actions:
        action = QAction(label, self)
        action.triggered.connect(lambda checked, t=action_type: self.on_menu_action(t))
        menu.addAction(action)
    
    menu.addSeparator()
    scold_action = QAction("生气", self)
    scold_action.triggered.connect(lambda: self.on_menu_action("scold"))
    menu.addAction(scold_action)
    
    menu.addSeparator()
    shop_action = QAction("🛒商店", self)
    shop_action.triggered.connect(self.open_shop)
    menu.addAction(shop_action)
    rename_action = QAction("改名字", self)
    rename_action.triggered.connect(lambda: self.on_menu_action("rename"))
    menu.addAction(rename_action)
    status_action = QAction("查看状态", self)
    status_action.triggered.connect(lambda: self.on_menu_action("status"))
    menu.addAction(status_action)
    
    menu.addSeparator()
    exit_action = QAction("退出", self)
    exit_action.triggered.connect(self.quit_application)
    menu.addAction(exit_action)
    
    menu.exec_(global_pos)

4.3 PyGame嵌入Qt窗口

这是一个关键的架构决策。最终方案是PyGame只作渲染引擎,Qt负责窗口管理

class PetWindow(QWidget):
    def _setup_pygame(self):
        pygame.font.init()
        self.pygame_surf = pygame.Surface((WINDOW_WIDTH, WINDOW_HEIGHT), pygame.SRCALPHA)
    
    def paintEvent(self, event):
        painter = QPainter(self)
        pixels = pygame.image.tobytes(self.pygame_surf, "RGBA")
        image = QImage(pixels, w, h, QImage.Format_RGBA8888)
        painter.drawImage(0, 0, image)
    
    def _update(self):
        self.brain.tick()
        self.renderer.render(self.pygame_surf, self.brain.current_emotion, dialogue)
        self.update()  # 触发 paintEvent

每次tick:brain更新状态 → renderer绘制到pygame surface → paintEvent将surface转为QImage显示。这样既享受了pygame的绘图API,又获得了Qt的窗口管理能力。

4.4 Q-Learning 行为引擎(详细设计)

宠物拥有一个轻量级的强化学习"大脑",核心是状态离散化 + Q表查询 + 奖励驱动更新。

状态空间设计

5 维连续属性通过 discretize() 映射到 3 级离散值:

def discretize(value: float, levels: int = 3) -> int:
    return min(levels - 1, max(0, int(value * levels / 100)))
维度 范围 0(低) 1(中) 2(高)
饥饿度 0-100 <33 33-66 >66
精力值 0-100 <33 33-66 >66
心情值 0-100 <33 33-66 >66
健康值 0-100 <33 33-66 >66
时间段 0-23 0-7(早) 8-17(中) 18-23(晚)

总状态数:3 × 3 × 3 × 3 × 3 = 243 种

动作空间(7 种)
ACTIONS = ["sleep", "play", "explore", "cuddle", "eat", "wander", "groom"]
Q 表结构

Q 表用字典实现,以状态元组为 key,每个 key 存 7 个动作的 Q 值:

# 状态 (hunger_lv, energy_lv, mood_lv, health_lv, period)
state = (2, 1, 0, 1, 1)

# Q 值示例
q_table[state] = {
    "sleep":   0.32,
    "play":    0.15,
    "explore": 0.28,
    "cuddle":  0.41,
    "eat":     0.73,
    "wander":  0.19,
    "groom":   0.22,
}

未访问过的新状态自动初始化为 random.uniform(0, 0.1)

动作选择策略
def choose_action(self, hunger, energy, mood, health, hour):
    state = self._state_key(hunger, energy, mood, health, hour)
    q_vals = self._get_q_values(state)

    # ε-greedy:20% 随机探索,80% 利用经验
    if random.random() < self.exploration_rate:
        return random.choice(ACTIONS)
    return max(q_vals, key=q_vals.get)

探索率初始 0.2,每次更新乘以 0.9995,最低 0.05。约 3000 次更新后降至 0.1。

奖励函数(完整)
def get_reward(self, action, hunger, energy, mood, health):
    reward = 0.0
    p = self.personality

    if action == "eat":
        reward += 1.0 if hunger > 50 else -0.5       # 饿了吃 → 正奖励
        if p: reward += p.get("affectionate") * 0.2   # 亲昵的猫更爱被喂

    elif action == "play":
        reward += 1.0 if energy > 40 else -1.0        # 有精力才玩
        reward += 0.5 if mood < 50 else 0.2           # 心情不好更需要玩
        if p:
            reward += p.get("energetic") * 0.5         # 活泼的猫爱玩
            reward += p.get("curious") * 0.3            # 好奇的猫爱玩

    elif action == "sleep":
        reward += 1.0 if energy < 40 else -0.3        # 累了才睡
        if p: reward -= p.get("energetic") * 0.3       # 活泼的猫不爱睡

    elif action == "cuddle":
        reward += 0.5 if mood < 60 else 0.2           # 心情差时求抱
        if p:
            reward += p.get("affectionate") * 0.5      # 亲昵的猫爱撒娇
            reward += p.get("clingy") * 0.3             # 粘人的猫爱撒娇

    elif action == "explore":
        reward += 0.5 if energy > 50 else -0.5        # 有精力才探索
        if p: reward += p.get("curious") * 0.6         # 好奇心驱动

    elif action == "wander":
        reward += 0.2                                   # 保底正奖励
        if p:
            reward += p.get("curious") * 0.2
            reward += p.get("energetic") * 0.1

    elif action == "groom":
        reward += 0.3 if health < 50 else 0.1         # 不健康时更需要
        if p: reward += p.get("stubborn") * -0.1       # 固执的不爱打理

    return reward
Q 值更新公式

标准 Q-Learning 更新:

Q(s, a) += α × [r + γ × max Q(s', a') - Q(s, a)]

对应代码:

current_q = q_vals[action]
max_next_q = max(next_q_vals.values())
new_q = current_q + LEARNING_RATE * (reward + DISCOUNT_FACTOR * max_next_q - current_q)
q_vals[action] = new_q
参数 说明
α(Learning Rate) 0.1 每次更新的步长
γ(Discount Factor) 0.9 对未来奖励的重视程度
ε(Exploration Rate) 0.2→0.05 探索概率(指数衰减)
自主行为循环

每 15 秒触发一次 _autonomous_action()

  1. 读取当前四维属性 + 当前小时
  2. choose_action() → 选择行为
  3. 执行行为 → 改变属性 → 获得 reward
  4. update() → 更新 Q 表
  5. 探索率衰减:ε *= 0.9995

最终宠物会自然学会:饿了找吃、累了睡觉、无聊了玩耍——完全通过试错,没有任何硬编码规则。

4.5 纯NumPy实现的Char-RNN(完整细节)

这是项目中"最硬核"的部分。一个字符级别的循环神经网络,完全用NumPy手动实现前向传播、反向传播(BPTT)和采样。

网络架构
输入(字符索引)
    ↓
Embedding(vocab_size × embed_dim)
    ↓
单层RNN(embed_dim → hidden_dim)
    ↓
Linear(hidden_dim → vocab_size)
    ↓
Softmax → 输出(下一个字符的概率分布)
前向传播
def forward(self, inputs, h_prev=None):
    T = len(inputs)
    xs = np.zeros((T, self.embed_dim))      # 输入序列
    hs = np.zeros((T + 1, self.hidden_dim))  # 隐状态序列
    hs[0] = h_prev or np.zeros((1, self.hidden_dim))

    for t in range(T):
        xs[t] = self.W_embed[inputs[t]]                         # Embedding 查找
        hs[t+1] = np.tanh(xs[t] @ self.W_xh + hs[t] @ self.W_hh + self.b_h)  # RNN 单元

    ys = hs[1:] @ self.W_hy + self.b_y                           # 输出层
    return xs, hs, ys
损失函数

交叉熵损失(Cross-Entropy Loss):

# Softmax
probs = np.exp(ys - np.max(ys, axis=1, keepdims=True))
probs /= np.sum(probs, axis=1, keepdims=True)

# Cross-Entropy
loss = -np.sum(np.log(probs[np.arange(T), targets] + 1e-8)) / T
反向传播(BPTT)

沿时间反向传播梯度,核心是链式法则沿时间步展开:

for t in reversed(range(T)):
    dy = probs[t:t+1].copy()
    dy[0, targets[t]] -= 1             # dSoftmax + dCrossEntropy 合并

    # 输出层梯度
    dW_hy += hs[t+1:t+2].T @ dy
    db_y += dy

    # RNN 隐层梯度(沿时间反向传播)
    dh = dy @ self.W_hy.T + dh_next
    dh_raw = (1 - hs[t+1:t+2] ** 2) * dh   # dtanh

    db_h += dh_raw
    dW_hh += hs[t:t+1].T @ dh_raw
    dW_xh += xs[t:t+1].T @ dh_raw
    dW_embed[inputs[t]] += (dh_raw @ self.W_xh.T).reshape(-1)

    dh_next = dh_raw @ self.W_hh.T       # 传递到上一个时间步
参数更新(SGD + 梯度裁剪)
for param, grad in [("W_embed", dW_embed), ("W_xh", dW_xh), ("W_hh", dW_hh),
                    ("b_h", db_h), ("W_hy", dW_hy), ("b_y", db_y)]:
    np.clip(grad, -5, 5, out=grad)              # 梯度裁剪,防止爆炸
    setattr(self, param, getattr(self, param) - lr * grad)  # SGD 更新
文本生成(Temperature 采样)
def sample(self, seed, length=30, temperature=0.8):
    h = np.zeros((1, self.hidden_dim))
    # 用 seed 序列预热隐状态
    for idx in seed_indices:
        emb = self.W_embed[idx].reshape(1, -1)
        h = np.tanh(emb @ self.W_xh + h @ self.W_hh + self.b_h)

    result = seed
    for _ in range(length):
        y = (h @ self.W_hy + self.b_y).reshape(-1) / temperature
        exp_y = np.exp(y - np.max(y))
        probs = exp_y / np.sum(exp_y)
        next_idx = np.random.choice(self.vocab_size, p=probs)  # 按概率采样
        next_char = self.idx_to_char(next_idx)
        if next_char == "\n": break
        result += next_char
    return result

temperature 控制生成随机性:值越低越保守(趋于常见字符),值越高越随机(可能产生新奇的组合)。

模型参数量计算
参数 Shape 参数量
W_embed 70 × 16 1,120
W_xh 16 × 64 1,024
W_hh 64 × 64 4,096
b_h 1 × 64 64
W_hy 64 × 70 4,480
b_y 1 × 70 70
总计 10,854

约 10.8K 参数,加上中间缓存约 28K 参数量。

训练流程
# main.py 首次启动调用
def train(model, epochs=200, lr=0.01):
    lines = load_corpus("corpus.txt")    # 加载语料
    batches = prepare_batch(model, lines) # 分词并编码

    for epoch in range(epochs):
        np.random.shuffle(batches)
        decay_lr = lr * (1 - epoch / epochs)  # 学习率线性衰减

        for batch in batches:
            inputs, targets = batch[:-1], batch[1:]
            loss = model.train_step(inputs, targets, decay_lr)

        # 每 1/3 进度打印一次 loss 和生成样本
        if (epoch + 1) % (epochs // 3) == 0:
            sample = model.sample("", length=15)
            print(f"epoch {epoch+1} loss={avg_loss:.2f} {sample[:20]}")
  • 语料格式:每行一个带标签的句子,如 <happy> I am so happy today!
  • 预处理:添加 <start> / <end> 标记,转为索引序列
  • 训练 200 epoch,loss 从 ~3.1 降至 ~0.59
  • 约 30 秒完成训练(纯 NumPy)
对话时混合策略
80% 概率 → 模板匹配(保证通顺自然,中文预设句子)
20% 概率 → RNN 自由生成(增加惊喜和多样性)

RNN 生成时传入情绪标签作为 seed(如 <happy>),控制输出风格。

4.6 记忆系统与数据持久化

记忆系统设计

记忆采用键值对存储,每条记忆包含三个字段:

{
    "last_food": {
        "time":  1700000000,    # 最后访问的 Unix 时间戳
        "value": "鸡肉",        # 记忆内容(可选)
        "count": 5              # 累计访问次数
    },
    "last_petted": {
        "time":  1700000500,
        "value": None,          # 无具体内容
        "count": 23
    }
}

7天半衰期衰减权重

def _weight(self, timestamp):
    days = (time.time() - timestamp) / 86400
    return 2.0 ** (-days / 7)
天数 权重
0 天 1.000
1 天 0.905
3 天 0.741
7 天 0.500
14 天 0.250
30 天 0.051

自动清理条件:权重 < 0.05 且 count < 3 → 删除。

数据持久化格式

所有数据存储在 brain_models/data/ 目录,使用 JSON + NPZ 两种格式。

brain_state.json — 宠物状态快照:

{
    "hunger": 30.0,
    "energy": 65.2,
    "mood": 55.0,
    "health": 80.0,
    "name": "小咪"
}

q_table.json — Q-Learning 状态-动作表:

{
    "q_table": {
        "2,1,0,1,1": {
            "sleep": 0.32,
            "play": 0.15,
            "explore": 0.28,
            "cuddle": 0.41,
            "eat": 0.73,
            "wander": 0.19,
            "groom": 0.22
        }
    },
    "exploration_rate": 0.082
}

状态元组 (2,1,0,1,1) 以逗号分隔字符串 "2,1,0,1,1" 作为 JSON key(JSON 不支持 tuple 作为 key)。

memory.json — 记忆数据:

{
    "last_food": {"time": 1700000000, "value": "鸡肉", "count": 5},
    "last_petted": {"time": 1700000500, "value": "被抚摸", "count": 23},
    "name_changed": {"time": 1699900000, "value": "小咪", "count": 1}
}

personality.json — 性格向量:

{
    "dims": {
        "affectionate": 0.65,
        "energetic": 0.52,
        "curious": 0.71,
        "stubborn": 0.28,
        "clingy": 0.43
    },
    "daily_deltas": {
        "affectionate": 0.04,
        "energetic": 0.02,
        "curious": 0.01,
        "stubborn": 0.0,
        "clingy": 0.03
    },
    "last_date": "2026-06-25"
}

daily_deltas 记录当日累计变化量,用于限制每日总变化不超过 ±0.1。
last_date 用于跨日重置累计变化量。

weights.npz — Char-RNN 权重(NumPy 压缩格式):

np.savez_compressed(path,
    W_embed=...,   # (70, 16)
    W_xh=...,      # (16, 64)
    W_hh=...,      # (64, 64)
    b_h=...,       # (1, 64)
    W_hy=...,      # (64, 70)
    b_y=...,       # (1, 70)
)

使用 np.savez_compressed 自动压缩,约 112KB。

保存与加载时机
事件 保存 加载
程序启动 ✅ 加载所有数据
退出
每 tick 自动实时写内存

4.7 互动响应情绪系统

宠物在接收到用户操作时,立即切换画面表情,给用户即时的视觉反馈。

实现原理(pet/brain.py),每个操作还附带金币奖励和叠加特效:

def interact(self, action_type: str) -> str:
    self.memory.remember(f"last_{action_type}")
    self.emotion_timer = FPS * 3  # 情绪保持3秒
    self.coins += COIN_REWARDS.get(action_type, 0)  # 互动赚金币

    if action_type == "pet":
        self.mood = min(100, self.mood + PET_PET_MOOD)
        self.personality.modify({"affectionate": 0.02, "clingy": 0.01})
        self._set_overlay("heart")  # 爱心特效
        self.current_emotion, self.current_action = self._pick_emotion([
            ("happy", "happy", 5),    # 50% 概率开心
            ("curious", "curious", 2), # 30% 概率好奇
            ("sleepy", "sleepy", 1),  # 20% 概率犯困
        ])
        return self.dialogue.generate("loving")

每个操作对应多种可能的情绪反馈,使用加权随机选择:

操作 可能情绪(权重)
摸摸头 happy(5) / curious(2) / sleepy(1)
喂食 happy(5) / curious(3) / playful(1)
玩耍 playful(5) / happy(3) / curious(2)
治疗 happy(5) / idle(2) / sleepy(1)
打招呼 happy(5) / curious(3) / playful(2)
洗澡 happy(5) / playful(3) / curious(1)
送礼物 excited(5) / happy(3) / playful(1)
称赞 excited(5) / happy(3) / cuddly(1)
讲故事 curious(5) / happy(2) / sleepy(2)
教本领 curious(4) / playful(3) / happy(2)
跳舞 dance(5) / excited(3) / happy(1)
生气 sad(5) / sleepy(2) / idle(1)

情绪切换后持续约3秒(emotion_timer),然后自动恢复为由属性数值决定的基础情绪。这样既保证了操作的即时反馈,又不影响宠物自主行为的连贯性。

tick() 中的关键逻辑:

def tick(self):
    # ... 属性衰减 ...
    if self.emotion_timer > 0:
        self.emotion_timer -= 1  # 持续显示互动情绪
    else:
        self.current_emotion = self._determine_emotion()  # 恢复自动判断

此外,查看状态不再弹出独立窗口,而是显示在宠物的对话气泡中,停留6秒:

elif action_type == "status":
    text = "饥饿:30/100  精力:70/100  心情:60/100  健康:80/100"
    self._show_dialogue(text, duration=FPS * 6)  # 6秒停留

4.8 互动视觉叠加特效

为了让每次互动更有"感觉",我实现了一个特效叠加系统。每个互动操作会触发对应的视觉特效,在宠物身上叠加显示2-3秒。

实现方式是在 renderer/sprites.py 中定义一系列 draw_xxx_overlay(surf, frame, progress) 函数,其中 progress 从 0→1 控制动画进度:

OVERLAY_FUNCTIONS = {
    "food": draw_food_overlay,      # 小鱼干掉落
    "heart": draw_heart_overlay,    # 爱心飘散
    "gift": draw_gift_overlay,      # 礼物盒弹跳
    "toy": draw_toy_overlay,        # 毛线球滚动
    "star": draw_star_overlay,      # 星星旋转上升
    "bubble": draw_bubble_overlay,  # 泡泡飘散
    "book": draw_book_overlay,      # 书本翻开
    "anger": draw_anger_overlay,    # 愤怒爆炸
    "sparkle": draw_sparkle_overlay,# 菱形闪光
}

特效与宠物的情绪动画同时渲染,在 brain 中通过 _set_overlay() 控制:

def _set_overlay(self, overlay_type: str, duration: int = None):
    self.visual_overlay = overlay_type
    dur = duration or FPS * 2        # 默认2秒
    self.overlay_duration = dur
    self.overlay_max_duration = dur

然后在渲染循环中计算 progress = 1.0 - (overlay_duration / overlay_max_duration),传入 overlay 函数实现平滑动画。


五、遇到的坑与解决方案

1. Pygame-ce字体初始化崩溃

问题:Python 3.14 + pygame-ce 2.5.7 下,调用 pygame.font.SysFont() 会触发Windows字体枚举,但是枚举返回的数据类型与Python 3.14不兼容,导致 splitext 报错 TypeError: expected str, not int

解决:放弃使用 SysFont,改为直接加载Windows字体目录下的具体字体文件:

def _find_chinese_font():
    paths = [
        "C:\\Windows\\Fonts\\simsun.ttc",
        "C:\\Windows\\Fonts\\msyh.ttc",
        "C:\\Windows\\Fonts\\simhei.ttf",
    ]
    for p in paths:
        if os.path.exists(p):
            return pygame.font.Font(p, 14)
    return pygame.font.Font(None, 16)  # 最后兜底

2. RNN训练速度过慢

问题:原始实现中,get_loss方法先调用forward进行前向传播,然后在反向传播中又重复计算了部分前向值,导致每个训练step做了2次前向传播。

解决:重写train_step方法,将前向传播和反向传播合并为一个函数,复用前向计算的结果,训练速度提升了约10倍(200 epoch从>2分钟缩短至约30秒)。

3. 透明窗口的事件穿透

问题:Qt透明窗口默认会让鼠标事件穿透到下层窗口,但我们需要在宠物身上捕获点击。

解决:不设置 WA_TransparentForMouseEvents,在 mousePressEvent 中通过 _is_on_pet() 判断点击位置是否在宠物的渲染矩形内,仅在矩形内处理事件。


六、如何使用

环境要求

  • Python 3.14+
  • 依赖:pygame-ce, PyQt5, numpy

安装运行

pip install pygame-ce PyQt5 numpy
cd ai_pet
python main.py

或双击 run.bat

首次启动会自动训练Char-RNN(约30秒),之后秒开。所有数据保存在 brain_models/data/ 目录,退出时自动保存。


七、项目结构

ai_pet/
├── main.py                      # 程序入口
├── config.py                    # 全局配置参数
│
├── pet/                         # AI 大脑模块
│   ├── brain.py                 # 大脑主控
│   ├── behavior.py              # Q-Learning 行为引擎
│   ├── personality.py           # 5维性格系统
│   ├── memory.py                # 记忆系统
│   └── dialogue.py              # 混合对话引擎
│
├── brain_models/                # 神经网络模块
│   ├── char_rnn.py              # 微型 Char-RNN
│   ├── train.py                 # 训练脚本
│   └── data/                    # 数据持久化
│       ├── brain_state.json
│       ├── q_table.json
│       ├── memory.json
│       ├── personality.json
│       ├── corpus.txt           # 训练语料
│       └── weights.npz          # 训练好的权重
│
├── renderer/                    # 渲染模块
│   ├── sprites.py               # 矢量精灵绘制 + 叠加特效
│   └── renderer.py              # 帧动画 + 对话气泡
│
├── desktop/                     # 桌面集成模块
│   ├── pet_window.py            # 透明穿透窗口 + 右键菜单
│   └── tray.py                  # 系统托盘
│
├── AIPet.spec                   # PyInstaller 打包配置
└── assets/                      # 资源目录

八、技术栈总结

组件 技术 用途
游戏循环/渲染 pygame-ce 矢量绘图、帧动画
桌面窗口 PyQt5 透明窗口、系统托盘、右键菜单
神经网络 numpy Char-RNN 训练与推理
行为决策 Q-Learning 状态-动作价值学习
数据格式 JSON + NPZ 配置/状态持久化

九、总结与展望

这个项目用纯Python实现了一个完整的AI桌面宠物系统,核心亮点在于:

  1. 零依赖AI —— RNN完全用NumPy手写,不依赖PyTorch/TensorFlow
  2. 零图片资源 —— 矢量风格绘图,全部用代码生成
  3. 零联网 —— 所有功能离线运行
  4. 可成长 —— Q-Learning让宠物越养越"懂你"

目前已经实现的扩展:

  • 15种互动操作(含跳舞、讲故事、教本领等)
  • 9种互动视觉特效

未来可以继续扩展的方向:

  • 更多互动小游戏(接球、拼图)
  • 多宠物同屏互动
  • 声音反馈系统
  • 自定义外观编辑器

项目完全开源,代码放在 GitHub。如果你也对桌面宠物或轻量AI感兴趣,欢迎Star和PR!
游戏源代码下载链接
游戏源码和游戏运行程序下载,可看公众号这篇文章


可以关注博主公众号 : 码来的小朋友

如果你觉得这篇文章对你有帮助,欢迎点赞、收藏、转发,让更多人看到用纯Python也能做出这么有趣的AI应用!

更多推荐