liuwei200000 个人主页

@liuwei200000

liuwei200000

2023-03-25 15:53:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-R1模型的训练流程中提到GRPO（组相对策略优化）

在复杂推理任务中实现了比传统PPO更高效的策略优化。这一方法不仅为DeepSeek-R1的低成本训练提供了技术基础，也为开源社区的RL算法创新提供了重要参考。

#人工智能

MoveIt Pro软件包应用与商业落地指南

MoveIt Pro是ROS 2生态中面向商业应用的机器人运动规划开发平台，在开源MoveIt基础上提供更稳定高效的功能和商业支持。其核心优势包括高保真仿真降低开发成本、先进运动规划提升效率、力控拓展应用场景、移动操作增强灵活性，以及工业集成加速落地。采用"开源核心+商业组件"模式，平衡成本与可控性。典型应用涵盖物料搬运、精密装配、表面处理等领域。商业落地需注意团队能力评估、技

#机器人

Dify的技术架构及对标产品对比

Dify作为一款开源的大型语言模型（LLM）应用开发平台，其技术架构设计以灵活性和可扩展性为核心，支持从开发到生产的全生命周期管理。通过对比可见，Dify在功能全面性、企业级支持和部署灵活性上表现突出，尤其适合中大型企业实现生成式AI的规模化落地。

#架构 #RAG

Dify的技术架构分析

Dify是一款开源LLM应用开发平台，采用四层模块化架构（应用交互/服务编排/模型运算/数据基础设施）实现功能解耦。核心功能包括可视化工作流编排、多模型接口管理（支持20+供应商）、混合检索引擎（BM25+向量）及插件系统。技术栈基于Python+Flask+React，支持Docker/K8s部署，提供高可用方案和二次开发接口。相比传统开发，可缩短周期4倍，降低90%运维成本，检索精度提升30%

Dify的技术架构分析

DeepSeek-R1模型的训练流程中提到GRPO（组相对策略优化）

#人工智能

DeepSeek-R1模型的训练流程

DeepSeek-R1模型的训练流程通过创新的强化学习（RL）框架和优化策略，实现了在推理任务上的突破性表现，同时显著降低了训练成本。

#人工智能

如何让虚拟机对外提供服务

本机系统环境：WinXP Win7虚拟机环境：Enterprise Linux 6该方法主要通过桥接方式，是局域网内或网外电脑能够访问虚拟机提供的服务，服务端口要在防火墙内添加设置，否则外部电脑将无发访问。主要设置步骤：1、虚拟机网络选择桥接方式；2、Vmware Workstation ->Edit ->Virtual NetWork

到底了