DeepSeek 开源项目推荐
Hugging Face 团队对 DeepSeek-R1 的完整复现,包括训练数据、脚本和多阶段训练流程。
以下是推荐的 DeepSeek 开源项目,涵盖模型复现、应用开发和工具集成等多个方面:
一、模型复现项目
1. Hugging Face 的 Open-R1
-
简介:Hugging Face 团队对 DeepSeek-R1 的完整复现,包括训练数据、脚本和多阶段训练流程。
-
特点:
-
蒸馏高质量推理数据集,构建通用语料库。
-
验证 GRPO 算法,通过纯强化学习训练模型。
-
支持跨领域迁移,扩展至代码生成和医学诊断。
-
-
GitHub 地址:Open-R1
2. 港科大 simpleRL-reason
-
简介:港科大团队对 DeepSeek-R1 的复现,专注于小模型训练。
-
特点:
-
使用 7B 参数的 Qwen2.5-Math 模型和仅 8000 个数学样本验证 R1 方法。
-
提供两种训练策略:SimpleRL-Zero(直接强化学习)和 SimpleRL(监督微调 + 强化学习)。
-
-
GitHub 地址:simpleRL-reason
3. 伯克利团队的 TinyZero
-
简介:伯克利团队对 DeepSeek R1-Zero 的复现,成本低至 30 美元。
-
特点:以倒计时游戏为测试场景,验证 R1-Zero 的推理能力。
-
GitHub 地址:TinyZero
二、应用开发项目
1. DeepSeek iOS 客户端高仿版
-
简介:基于 SwiftUI 开发的移动端 AI 应用,集成 DeepSeek API。
-
特点:
-
支持实时对话、多轮交互、历史记录管理和自定义提示词。
-
提供流畅的 AI 对话体验。
-
-
GitHub 地址:DeepSeek iOS 客户端
2. DeepSeek Engineer
-
简介:编程辅助工具,集成 DeepSeek API。
-
特点:
-
处理用户对话并生成结构化的 JSON 响应。
-
支持读取本地文件内容、创建新文件和实时编辑。
-
-
GitHub 地址:DeepSeek Engineer
3. DeepSeek AI 浏览器扩展
-
简介:非官方的浏览器扩展插件,基于 DeepSeek API。
-
特点:
-
提供智能的网页交互体验。
-
通过文本选择获得 AI 驱动的实时响应。
-
-
GitHub 地址:DeepSeek AI
三、工具与集成
1. gpt4free
-
简介:支持免费调用 DeepSeek V3/R1 等主流大模型。
-
特点:
-
用户无需支付 API 费用即可体验。
-
支持多种大模型,方便开发者快速上手。
-
-
GitHub 地址:gpt4free
2. Unlock-DeepSeek
-
简介:由 DataWhale 团队推出的开源项目,旨在深入解读并复现 DeepSeek 系列工作。
-
特点:
-
提供详细的代码实现和文档。
-
适合希望深入了解 DeepSeek 技术细节的开发者。
-
-
GitHub 地址:Unlock-DeepSeek
3. Awesome DeepSeek Integration
-
简介:DeepSeek 官方团队整理的集成应用项目合集。
-
特点:
-
汇总了多种工具和应用,覆盖日常对话、AI 编程、大模型开发和 RAG 知识库等多个领域。
-
帮助用户在不同平台上使用 DeepSeek 的强大功能。
-
-
GitHub 地址:Awesome DeepSeek Integration
这些开源项目涵盖了从模型复现到应用开发的多个方面,适合不同需求的开发者和研究者。希望这些资源能帮助你更好地探索和应用 DeepSeek。
更多推荐




所有评论(0)