
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章系统介绍了AI大模型的五大核心技术(Prompt Engineering、LangChain、Fine-tuning、RAG、LlamaIndex)和四阶段学习路线,帮助零基础学员3个月内掌握工业级开发能力。内容涵盖技术架构、实战案例、避坑指南,并强调掌握Prompt+LangChain+RAG三大技术可带来45%的薪资溢价。文章提供从基础到进阶的完整学习路径,适合转型开发者及AI爱好者。

文章系统介绍了AI大模型的五大核心技术(Prompt Engineering、LangChain、Fine-tuning、RAG、LlamaIndex)和四阶段学习路线,帮助零基础学员3个月内掌握工业级开发能力。内容涵盖技术架构、实战案例、避坑指南,并强调掌握Prompt+LangChain+RAG三大技术可带来45%的薪资溢价。文章提供从基础到进阶的完整学习路径,适合转型开发者及AI爱好者。

AI智能体正从被动工具进化为主动伙伴,具备规划、记忆和工具使用三大核心能力,通过"观察-决策-行动"循环机制完成任务。实在智能的"实在Agent"等产品已实现"一句指令,自动完成"的工作模式,广泛应用于客服、跨境、内容创作、数据分析、制造业等领域。未来,AI智能体将重塑人机协作模式,人类专注于创新决策,AI负责执行任务。学习大模型技术已成为抓住AI风口的关键,掌握AI智能体技术将带来职业发展新机遇

AI智能体正从被动工具进化为主动伙伴,具备规划、记忆和工具使用三大核心能力,通过"观察-决策-行动"循环机制完成任务。实在智能的"实在Agent"等产品已实现"一句指令,自动完成"的工作模式,广泛应用于客服、跨境、内容创作、数据分析、制造业等领域。未来,AI智能体将重塑人机协作模式,人类专注于创新决策,AI负责执行任务。学习大模型技术已成为抓住AI风口的关键,掌握AI智能体技术将带来职业发展新机遇

本文详细介绍了基于人类反馈的强化学习(RLHF)技术,从基本概念到实践应用。重点阐述了三步法中的奖励模型训练和强化学习过程,分享了使用DeepSpeed-Chat框架训练大模型时的实际问题和解决方案,包括模型生成重复文本、强制生成到最大长度等问题,并提供了如奖励缩放等实用技巧,帮助读者成功训练出效果提升的自己的大模型。

本文详细介绍了基于人类反馈的强化学习(RLHF)技术,从基本概念到实践应用。重点阐述了三步法中的奖励模型训练和强化学习过程,分享了使用DeepSpeed-Chat框架训练大模型时的实际问题和解决方案,包括模型生成重复文本、强制生成到最大长度等问题,并提供了如奖励缩放等实用技巧,帮助读者成功训练出效果提升的自己的大模型。

文章分析了Java在开发大模型智能体方面的局限性,指出Java生态系统不适用于智能体开发,语言本身"太重"不适合快速迭代。而Python已形成完整的AI技术栈,在实际落地中占据90%以上市场份额。作者强调Java更适合作为智能体的调用层而非开发层,Java开发者若要进入AI领域,需转向Python生态。

文章分析了Java在开发大模型智能体方面的局限性,指出Java生态系统不适用于智能体开发,语言本身"太重"不适合快速迭代。而Python已形成完整的AI技术栈,在实际落地中占据90%以上市场份额。作者强调Java更适合作为智能体的调用层而非开发层,Java开发者若要进入AI领域,需转向Python生态。

本次微调经验分享依据于我们参加的“第2届·百度搜索创新大赛——搜索答案组织”整个比赛过程。我们团队选择的基座模型是ChatGLM3-6B-Base模型,训练数据集为官方提供的数据集(9000条),训练方法为LORA sft 监督微调。最终结果:score 36.12–ROUGE-L 41.03–BLEU-4 31.22,东三省排名第1名,全国最终排名为44/220。

本文整理一些文本向量化(embedding)和信息检索的知识,它们是如今大模型生成文本时常用的技术 —— “增强检索生成”(RAG)—— 的基础。








