社区云

DeepSeek

FIT2CLOUD飞致云来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 5小时前

操作教程｜MaxKB开源智能体平台版本迁移工具使用指南（V1至V2）

欢迎您体验MaxKB V2版本！

#开源 #人工智能 #DeepSeek

258 

2 
陈敬雷-充电了么-CEO兼CTO 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 6小时前

深度拆解 DeepSeek-V3/R1 推理架构！从核心组件到工作流，揭秘高效推理的底层逻辑

本文深度解析了DeepSeek-V3/R1推理系统的架构设计与工作流程。该系统通过API服务器、负载均衡器（预填充/解码/专家并行）、预填充服务、解码服务及外部键值缓存等核心组件的协同运作，实现了高效推理。重点阐述了负载均衡器如何根据实例负载动态分配请求，以及专家并行机制如何优化GPU计算资源利用率。文章还详细介绍了从请求接收、负载均衡、专家分配到结果缓存的全流程，展现了系统在吞吐量、响应速度和可

#架构 #人工智能 #自然语言处理 +2

374 

13 
陈敬雷-充电了么-CEO兼CTO 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 9小时前

DeepSeek 知识蒸馏：让小模型拥有大模型 “超能力”，AI 落地成本直降 90% 的核心秘密

对于经过蒸馏处理后的模型，在后续操作中仅采用了监督微调的方式，并未将强化学习阶段纳入其中。从以往的经验和相关研究可以知晓，若加入强化学习，能够在很大程度上进一步提升模型的性能。但此次研究的核心目的在于重点展示蒸馏技术本身的有效性，因此将强化学习阶段的深入探索留给更广泛的研究群体，以便众多研究人员能从不同视角深入挖掘与拓展，从而有力地推动整个领域的发展。通过这样的安排，清晰直观地呈现出蒸馏技术在赋予

#人工智能 #机器学习 #transformer +3

444 

14 
charlee44 来自魔乐社区

modelers.csdn.net · 2025-07-27 22:32:01

PandasAI连接LLM进行智能数据分析

PandasAI通过自定义LLM接口实现与DeepSeek模型的智能数据分析。

#AI #DeepSeek #数据分析

772 

5 
bugyinyin 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 11小时前

【大模型开发必备】使用FastAPI构建DeepSeek和Qwen聚合服务，全程干货，小白也能轻松学会！！

本文详细介绍了如何使用FastAPI框架构建大模型聚合服务，通过集成DeepSeek和Qwen两大主流大模型实现统一API调用。内容涵盖FastAPI框架优势、API Key获取、环境变量配置、依赖库安装及核心代码实现，帮助开发者高效构建自己的大语言模型服务，提升开发效率和应用灵活性。

#fastapi #人工智能 #DeepSeek

468 

12 
发菜君来自魔乐社区

modelers.csdn.net · 2025-02-17 18:57:33

ICML 2024大语言模型研究综述：507篇论文深度解析

国际机器学习会议（International Conference on Machine Learning，简称ICML）是机器学习领域最具影响力的国际学术会议之一。ICML聚集了来自全球范围内的学者、研究人员和从业者，以分享他们在机器学习领域的最新研究成果、进展和创新想法。今年的 ICML 会议已在 2024 年 7 月 21 日~ 7 月 27 日于奥地利维也纳举办。据官方邮件通知，今年 IC

#语言模型 #人工智能 #自然语言处理 +3

1573 

12 
IT莫燃来自魔乐社区

modelers.csdn.net · 2025-07-01 21:55:18

AI赋能智慧餐饮：Spring Boot+大模型实战指南

Spring Boot处理高并发订单 + DeepSeek语义理解 + OpenCV视觉识别。行业验证：方案在米其林三星餐厅落地，翻台率提升40%新菜品无历史数据 → 预测偏差 > 200%高峰期推荐响应 > 5秒 → 顾客放弃使用。避坑要点：来自200家餐厅的数字化转型经验。：300人餐厅，15个服务员仍排长队。：食材损耗率高达25%，成本失控。餐厅灯光导致识别准确率下降40%菜品识别需支持20

#人工智能 #spring boot #后端 +1

1007 

27 
陈敬雷-充电了么-CEO兼CTO 来自魔乐社区

modelers.csdn.net · 2025-07-30 18:36:50

强化学习顶流算法PPO：从原理到代码，为什么它成了AI大模型训练的「万能钥匙」？

PPO的成功并非偶然：它用「剪辑」这一简单机制解决了策略优化的核心难题（更新稳定性），用「多轮迭代」提高了样本效率，用「Actor-Critic+熵正则化」平衡了探索与利用。对于研究者，它是快速验证想法的「瑞士军刀」；对于工程师，它是落地强化学习应用的「可靠工具」。未来，PPO的改进方向聚焦于「更精细的更新控制」（如自适应( \epsilon )）和「与其他技术的融合」（如离线强化学习、分层强化学

#人工智能 #算法 #transformer +2

756 

8 
Code_流苏来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

DeepSeek-V3.1-Terminus深度解析：语言一致性、Agent能力增强，“终极版本“来了？

9月22日晚，DeepSeek悄悄发布了一个名字听起来就很厉害的新模型——DeepSeek-V3.1-Terminus，这个"终极版"到底有什么特别之处呢？

#人工智能 #AI #DeepSeek

570 

23 
陈敬雷-充电了么-CEO兼CTO 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

基于vLLM本地部署企业级DeepSeek大模型

本文介绍了基于vLLM本地部署企业级DeepSeek大模型的方法。vLLM是一款专为大型语言模型设计的高效推理工具库，具有高性能推理能力、灵活兼容性和便捷开发体验。其技术架构包括调度器、模型执行器、内存管理器等核心组件，支持多种并行计算策略和先进的内存管理机制。文章详细说明了vLLM的安装步骤，包括系统要求、虚拟环境创建、CUDA配置等，并提供了验证安装成功的方法。通过vLLM部署DeepSeek

#人工智能 #DeepSeek #python

649 

11 
陈敬雷-充电了么-CEO兼CTO 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

Ollama本地部署DeepSeek大模型

本文介绍了如何利用Ollama开源框架在Windows和Linux平台上本地部署DeepSeek大模型。Ollama简化了大型语言模型的本地部署与管理，支持多种模型格式和硬件加速。具体步骤包括：下载安装Ollama，配置环境变量，选择合适的DeepSeek模型版本进行部署，并通过Python代码调用模型接口。文章还提供了Linux平台的一键安装命令和Windows的详细安装流程，帮助开发者高效利用

#人工智能 #自然语言处理 #python +1

959 

31 
瓷tun 来自葡萄城开发者空间

grapecity.csdn.net · 2025-09-22 16:11:50

RXT4090驱动DeepSeek多模态推理提升跨境电商客服案例解析

本文探讨RXT4090驱动DeepSeek多模态模型在跨境电商客服中的应用，涵盖硬件优势、模型优化、部署实践及系统集成，实现低延迟图文理解与智能响应，显著提升服务效率与商业价值。

#DeepSeek

565 

15 
小胖胖来自 2048 AI社区

2048ai.net · 2025-09-22 22:29:24

告别复制粘贴！Chat2File-DeepSeek 让 DeepSeek 对话成果直接变“成品”

文章摘要： Chat2File-DeepSeek 是一款提升 AI 对话成果转化效率的工具，支持一键将 DeepSeek 的对话内容导出为多种实用格式（如代码、文档、表格等），解决复制粘贴的繁琐问题。针对开发者，可快速生成可执行的 Jupyter Notebook；对学生/研究者，能导出含公式的 Word 或 EPUB 电子书；为产品/运营人员提供 Excel 和 PNG 导出功能；帮助内容创作者

#AI #DeepSeek

1493 

43 
OliverYeung 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-09-22 08:00:00

【AskAI系列课程】：P3.Agno从阿里云百炼知识库中检索知识库片段并回答用户问题

深入讲解如何实现阿里云百炼 retriever 并集成到 Agno Agent 中，构建智能问答系统的核心检索功能。

#人工智能 #AI #RAG +1

936 

12 
陈敬雷-充电了么-CEO兼CTO 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 2025-09-21 21:53:33

DeepSeek后训练：监督微调策略，开启模型优化新时代

《DeepSeek-V3后训练：监督微调策略优化》介绍了DeepSeek-V3模型在后训练阶段的关键优化技术。文章详细阐述了监督微调（SFT）策略，包括针对推理数据（数学、代码等）和非推理数据（创意写作等）的不同处理方法。通过结合专家模型生成数据、强化学习优化以及人工标注验证，模型在150万实例数据集上实现了性能提升。两轮微调采用余弦退火学习率调度和样本掩码策略，有效提升了模型任务表现。本文节选自

#人工智能 #DeepSeek #python

566 

10 
乱世刀疤来自广州城市开发者社区

devpress.csdn.net/guangzhou · 2025-04-08 21:04:24

Ubuntu 22 Linux上部署DeepSeek+RAG知识库操作详解（Dify方式）之2

熟练掌握Ubuntu上通过Dify+Xinference本地化部署deepseek，打造自己的知识库。

#人工智能 #DeepSeek #RAG +1

367 

13 
健忘的派大星来自广州城市开发者社区

devpress.csdn.net/guangzhou · 2025-06-26 11:39:59

无需云端！三步实现DeepSeek大模型本地化部署——Ollama＋DeepSeek+ChatBox

🌟💯 为什么选择DeepSeek R1进行本地化部署？ 🤔📌成本优势明显💰云端AI服务往往需要支付高额的订阅费，而DeepSeek R1本地化部署则完全无需这笔开支。以OpenAI o1为例，每月需200美元的费用，长期使用下来可不是一笔小数目。而DeepSeek R1让你在本地轻松运行，轻松省掉这笔不小的开支，经济又实惠👍

#人工智能 #DeepSeek

777 

25 
正在走向自律来自广州城市开发者社区

devpress.csdn.net/guangzhou · 2025-08-03 19:53:16

DeepSeek和Kimi结合，3分钟制作PPT，很强！

本文详细介绍了企业微信API对接的完整流程，涵盖从环境搭建到功能实现的全过程。主要内容包括：1）获取企业微信第三方token；2）使用Docker部署应用环境；3）通过二维码验证实现登录授权；4）核心功能接口实现：获取用户列表（支持分页）、单发消息、按标签群发消息；5）源码解析与关键代码示例。文档提供了完整的HTTP接口调用方式和参数说明，并附有详细的伪代码实现和中文注释。该方案经过实际项目验证，

#人工智能 #DeepSeek

1370 

28 

标签介绍

DeepSeek

——DeepSeek

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net