ll1b_02 个人主页

@ll1b_02

ll1b_02

2026-04-15 16:11:53 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

2025年大模型技术演进：从DeepSeek到Omni的全景回顾

从2024年底DeepSeek"诺曼底登陆"以来，2025年开源和闭源模型迭代速度和开源质量远超以往几年。经常会遇到当T时刻在领域benchmark上优化到SOTA之后，T+1时刻有更优的通用模型公布，在领域benchmark指标反而比你专门优化的领域大模型更好。经历过几轮类似事件后，理解到做领域大模型的本质其实是产出一套稳健的训练方案Training-Recipe。

#人工智能 #语言模型

2025年大模型技术演进深度解析：从DeepSeek到Omni全景回顾

3.后来读研一年多，潜修内功，学了vLLM，peft之类的训练框架，做了几个横向课题，对简单业务熟练了。选择了小厂继续做rag，不过这边有agent开发内容，学会了langchain那些框架，有一说一感觉没啥用，自己也能写，纯应用层包装，门槛特低。总结：互联网中厂大厂，尤其是给你权限给你机器玩的，去，提升极大。小公司or普通研究院，非常一般。海面了好几家公司，靠以前的课题项目和pku一个研究院切合

#人工智能 #语言模型

2025年大模型技术演进：从DeepSeek到Omni全景回顾

#人工智能 #语言模型

2025年大模型技术演进深度解析：从DeepSeek到Omni的全景回顾

#人工智能 #语言模型

GitHub Copilot vs Claude Code：深度对比

【本段核心】2025 年秋季，斯坦福计算机系出现了一门排课火爆的新课 —— CS146S: The Modern Software Developer（现代软件研发者）。这门课由 Mihail Eric 主讲，他是斯坦福校友，曾在 Amazon Alexa 担任技能主管，创办过 YC 孵化的 AI 编程公司，如今重返母校，开设了斯坦福历史上第一门专注于 AI 软件研发的课程。【本段核心】一、这门课

#人工智能 #神经网络

AI Agent开发入门门槛真的低吗：需要多久

就像十几年前移动互联网刚兴起的时候，那时候会搞安卓APP的人，哪怕学历不高，现在很多都成了大佬。现在是AI Agent的黄金窗口期，需求大，但能踏踏实实干实事的人太少。你要做的就是能成为那个能干活的人。“钱景”是肯定有的，重点是怎么拿到offer。现在这行正处于爆发期，月薪3-4w很常见，搞得好年薪80万往上都有可能，大量高薪酬待遇岗都在招，我们这种中小厂都能给到40w税后。不用太纠结学历，AI

#人工智能 #神经网络 #机器学习

AI Agent设计模式深度对比：适用场景与优缺点

Multi-Agent Planner靠多Agent分工协作处理复杂任务，效率高但架构较复杂。适合需要工具辅助的任务(查资料、跑数据库、复杂计算等；优点是推理轨迹清晰，便于追溯；缺点是推理链过长可能导致延迟上升，需限制循环步数。最近两年，大家都可以看到AI的发展有多快，我国超10亿参数的LLM，在短短一年之内，已经超过了100个，现在还在不断的发掘中，时代在瞬息万变，我们又为何不给自己多一个选择，

#RAG

到底了