
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
从2024年底DeepSeek"诺曼底登陆"以来,2025年开源和闭源模型迭代速度和开源质量远超以往几年。经常会遇到当T时刻在领域benchmark上优化到SOTA之后,T+1时刻有更优的通用模型公布,在领域benchmark指标反而比你专门优化的领域大模型更好。经历过几轮类似事件后,理解到做领域大模型的本质其实是产出一套稳健的训练方案Training-Recipe。
3.后来读研一年多,潜修内功,学了vLLM,peft之类的训练框架,做了几个横向课题,对简单业务熟练了。选择了小厂继续做rag,不过这边有agent开发内容,学会了langchain那些框架,有一说一感觉没啥用,自己也能写,纯应用层包装,门槛特低。总结:互联网中厂大厂,尤其是给你权限给你机器玩的,去,提升极大。小公司or普通研究院,非常一般。海面了好几家公司,靠以前的课题项目和pku一个研究院切合
3.后来读研一年多,潜修内功,学了vLLM,peft之类的训练框架,做了几个横向课题,对简单业务熟练了。选择了小厂继续做rag,不过这边有agent开发内容,学会了langchain那些框架,有一说一感觉没啥用,自己也能写,纯应用层包装,门槛特低。总结:互联网中厂大厂,尤其是给你权限给你机器玩的,去,提升极大。小公司or普通研究院,非常一般。海面了好几家公司,靠以前的课题项目和pku一个研究院切合
从2024年底DeepSeek"诺曼底登陆"以来,2025年开源和闭源模型迭代速度和开源质量远超以往几年。经常会遇到当T时刻在领域benchmark上优化到SOTA之后,T+1时刻有更优的通用模型公布,在领域benchmark指标反而比你专门优化的领域大模型更好。经历过几轮类似事件后,理解到做领域大模型的本质其实是产出一套稳健的训练方案Training-Recipe。即不管通用SOTA模型如何变化
【本段核心】2025 年秋季,斯坦福计算机系出现了一门排课火爆的新课 —— CS146S: The Modern Software Developer(现代软件研发者)。这门课由 Mihail Eric 主讲,他是斯坦福校友,曾在 Amazon Alexa 担任技能主管,创办过 YC 孵化的 AI 编程公司,如今重返母校,开设了斯坦福历史上第一门专注于 AI 软件研发的课程。【本段核心】一、这门课
就像十几年前移动互联网刚兴起的时候,那时候会搞安卓APP的人,哪怕学历不高,现在很多都成了大佬。现在是AI Agent的黄金窗口期,需求大,但能踏踏实实干实事的人太少。你要做的就是能成为那个能干活的人。“钱景”是肯定有的,重点是怎么拿到offer。现在这行正处于爆发期,月薪3-4w很常见,搞得好年薪80万往上都有可能,大量高薪酬待遇岗都在招,我们这种中小厂都能给到40w税后。不用太纠结学历,AI
Multi-Agent Planner靠多Agent分工协作处理复杂任务,效率高但架构较复杂。适合需要工具辅助的任务(查资料、跑数据库、复杂计算等;优点是推理轨迹清晰,便于追溯;缺点是推理链过长可能导致延迟上升,需限制循环步数。最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的LLM,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,







