
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
之前在职的时候给一些算法的同学讲解过verl的框架设计、实现细节以及超参配置,写这篇文章姑且作为离职修养这段时期的复健。本文中提到的做法和思路可能随着时间推移有变化,或者是思想迪化,仅代表个人理解。如果有错漏的地方还请指出。现在知乎上已有若干verl的使用相关文章了,覆盖了整体架构和快速的使用方法。本文将尝试从整体设计思路出发,致力于帮助不熟悉infra相关知识的算法同学快速理解整体框架,能自己上

本文介绍了一个极佳的个人知识库解决方案:Clipper+Obsidian+Copilot组合。通过Clipper一键抓取网页内容到Obsidian,配置Copilot插件接入云端DeepSeek大模型(免费2000万Tokens),实现文件对话和整个知识库对话功能。该方案满足内容抓取、本地知识库对话、辅助写作等需求,无需本地部署大模型,操作简单高效,是提升学习和工作效率的理想工具。

“这是本周第十个声称精通大模型却只会在ChatGPT上提问的面试者了。”主面试官叹息道,将简历轻轻推到一边。这样的场景在2026年的招聘市场中正变得日益普遍。根据最新行业数据,全球92%的科技企业已将大语言模型能力纳入核心产品架构-2。但与此同时,真正具备系统化大模型技能的开发者却仍是稀缺资源。

“这是本周第十个声称精通大模型却只会在ChatGPT上提问的面试者了。”主面试官叹息道,将简历轻轻推到一边。这样的场景在2026年的招聘市场中正变得日益普遍。根据最新行业数据,全球92%的科技企业已将大语言模型能力纳入核心产品架构-2。但与此同时,真正具备系统化大模型技能的开发者却仍是稀缺资源。

自注意力机制中,查询向量与键向量点积后直接使用softmax会导致数值过大,造成注意力坍塌和梯度消失问题。通过引入缩放因子√d_k对点积结果进行缩放,可稳定softmax输入值的方差,保持其非线性放大作用,突出真正相关的token,同时避免数值过大导致的训练失效问题。这是Transformer模型有效训练的关键技术之一。

自注意力机制中,查询向量与键向量点积后直接使用softmax会导致数值过大,造成注意力坍塌和梯度消失问题。通过引入缩放因子√d_k对点积结果进行缩放,可稳定softmax输入值的方差,保持其非线性放大作用,突出真正相关的token,同时避免数值过大导致的训练失效问题。这是Transformer模型有效训练的关键技术之一。

文章分析了AI Agent在企业应用中面临的困境,包括模型本身的不一致、不真实、及时性问题,以及工程化落地难度被低估。提出解决方案是构建工程化能力完备、与业务系统深度集成、具备企业级安全保障的Agent平台。以金蝶苍穹Agent平台为例,介绍了其通过内置业务模板、开放技术标准和私有化部署等特点,帮助企业快速实现AI Agent落地,解决从Demo到实践的转化难题。

文章分析了AI Agent在企业应用中面临的困境,包括模型本身的不一致、不真实、及时性问题,以及工程化落地难度被低估。提出解决方案是构建工程化能力完备、与业务系统深度集成、具备企业级安全保障的Agent平台。以金蝶苍穹Agent平台为例,介绍了其通过内置业务模板、开放技术标准和私有化部署等特点,帮助企业快速实现AI Agent落地,解决从Demo到实践的转化难题。

AI是未来10年的时代红利,行业人才缺口大,薪资水平高。即使零基础、学历普通,通过系统学习AI技术也能获得高薪就业。黑马程序员AI课程提供与大厂合作的实战项目,帮助学员掌握大模型等核心技术,实现职场逆袭。多位学员通过该课程成功转型AI行业,薪资达25-30万。抓住AI红利,投资自己,是实现职业跃迁的最佳选择。

AI是未来10年的时代红利,行业人才缺口大,薪资水平高。即使零基础、学历普通,通过系统学习AI技术也能获得高薪就业。黑马程序员AI课程提供与大厂合作的实战项目,帮助学员掌握大模型等核心技术,实现职场逆袭。多位学员通过该课程成功转型AI行业,薪资达25-30万。抓住AI红利,投资自己,是实现职业跃迁的最佳选择。








