m0_64826060 个人主页

@m0_64826060

m0_64826060

2024-02-21 17:16:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

OpenClaw Skills 系统深度解析：从源码到自定义技能

ClawHub 是 OpenClaw 的公共技能注册表公开、版本化、可搜索任何人都可以发布技能社区驱动的评分与评论自动审核（报告机制）让我们从头创建一个A 股股价查询技能，命名为。Skills 是 OpenClaw 的可插拔能力单元，通过SKILL.md定义，分层加载三层优先级：workspace > managed > bundled，同名覆盖无压力Gating 机制（`requires.*）确

#人工智能 #深度学习 #python

SignRoundV2 深度解析：大模型极低比特量化的 “精度救星”，2 比特也能稳跑生产级任务

SignRoundV2 的成功，本质是 “用更聪明的方法做资源分配”—— 通过 DeltaLoss 精准找到敏感层，用预调优初始化稳住极低比特训练，最终实现 “低比特、高精度、低成本” 的三者平衡。量化不是 “暴力压缩”，而是 “精准适配”，未来的大模型部署，必然是 “量化 + 稀疏 + 混合精度” 的组合拳，而 SignRoundV2 已经走在了前面。如果你正在做大模型部署，或者对量化技术感兴趣

#人工智能 #深度学习

【万字长文】搞懂GRPO算法原理和基础代码，看这一篇就够了！

基础 GRPO：核心是对比策略 / 参考模型的概率，结合优势值优化生成偏好；裁剪 GRPO：限制 ratio 范围，避免单次更新幅度过大；KL 散度 GRPO：惩罚模型偏离参考模型，保留基础语言能力；实际落地中，带裁剪 + KL 散度的 GRPO是最稳定的选择，也是工业界微调大模型的主流方案之一。

#python

SignRoundV2 深度解析：大模型极低比特量化的 “精度救星”，2 比特也能稳跑生产级任务

#人工智能 #深度学习

到底了