
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
不得不说,2022 年底 ChatGPT 的横空出世,直接把人工智能推上了全民热议的风口。哪怕是不太懂技术的人,也或多或少听过这个名字。我最开始接触它时,也只粗浅认为它就是个很会聊天的 AI 工具,甚至把 GPT 当成一个普通品牌代号,跟常见的产品商标没区别,完全没多想背后的含义。直到真正拆解 ChatGPT 这几个字母,才发现:这个名字根本不是随便起的,每一个字母,都在直白告诉我们大模型最核心的

说完了大家眼中不同的 AI Coding 工具,我也必须再强调一下,即使大家聊的都是「AI Coding 工具的 Agent 模式」,因为身份不同,每个人的用法也会有很大差异,大家对工具的预期也完全不同。传统的软件工程师:使用 AI Coding 工具完成自己工作过程中的一些辅助性工作,对于自身的能力和工作的要求有较高的要求。

文章介绍了AI工程的三次进化阶段:Prompt Engineering(提示词工程)、Context Engineering(上下文工程)和Harness Engineering(驾驭工程)。从简单的Prompt调优开始,逐步深入到如何管理上下文信息,再到构建完整的驾驭工程体系,确保AI应用在生产环境中的稳定性和可靠性。自己做 AI 应用的前半年,几乎所有精力都花在一件事上——调 Prompt。改

大语言模型(Large Language Model,LLM)是指参数规模达到数十亿甚至万亿级别的深度学习语言模型,能够理解和生成人类语言,在2022年ChatGPT发布后引发全球AI革命。大模型预训练工程师是LLM领域的"金字塔尖"岗位,负责设计和训练大语言模型的基座,决定模型的能力上限。设计Transformer架构变体(FlashAttention、Mamba等)构建千卡/万卡级分布式训练系

大语言模型(Large Language Model,LLM)是指参数规模达到数十亿甚至万亿级别的深度学习语言模型,能够理解和生成人类语言,在2022年ChatGPT发布后引发全球AI革命。大模型预训练工程师是LLM领域的"金字塔尖"岗位,负责设计和训练大语言模型的基座,决定模型的能力上限。设计Transformer架构变体(FlashAttention、Mamba等)构建千卡/万卡级分布式训练系

大语言模型(Large Language Model,LLM)是指参数规模达到数十亿甚至万亿级别的深度学习语言模型,能够理解和生成人类语言,在2022年ChatGPT发布后引发全球AI革命。大模型预训练工程师是LLM领域的"金字塔尖"岗位,负责设计和训练大语言模型的基座,决定模型的能力上限。设计Transformer架构变体(FlashAttention、Mamba等)构建千卡/万卡级分布式训练系

本文围绕大模型算法工程师的11个热门方向进行了深入分析,涵盖推理能力训练、Agentic Search训练、Agent/Tool Use训练等。文章详细介绍了每个方向的技术特点、发展趋势和面试重点,为想要入行大模型算法的程序员提供了实用的指导。无论你是校招还是社招,都能从中找到适合自己的方向,并了解如何提升面试竞争力。我最近几个月面了不少人,也被不少人问过同一个问题:现在入行大模型算法,到底该选什

本文分析了当前AI岗位的薪资现状,指出AI行业正在爆发但存在“两极分化”,高薪岗位主要集中在算法、大模型等领域,而普通应用层岗位薪资普遍不高。文章建议新手先从内容、运营等入门岗位积累经验,逐步提升技能,最终向高薪岗位发展。同时强调AI应用层和商业化岗位需求增加,鼓励读者关注真正有价值的AI落地机会,避免盲目跟风。近段时间,我在看一些AI的岗位,发现很多AI岗位薪资不高,有的甚至很低,比传统岗位还低

随着DeepSeek的持续爆火,AI大模型工程化开发领域彻底迎来风口,市场上相关岗位需求一路飙升,成为后端工程师转行、进阶的热门选择。很多从事后端开发的小伙伴,看着火爆的行业趋势,都想转型AI大模型工程化工程师,但大多陷入迷茫:不知道该从哪里入手、要学哪些技能、学习顺序怎么安排。

什么是 Ralph Loop?Ralph Loop 是一种自主迭代循环机制。你给出一个任务和完成条件后,代理开始执行该任务;当模型在某次迭代中尝试结束时,一个 Stop Hook 会拦截试图退出的动作,并重新注入原始任务提示,从而创建一个自我参照的反馈循环。在这个循环中,模型可以读取上一次迭代改动过的文件、测试结果和 git 历史,并据此逐步修正自己的输出直到达到完成条件或达到设定的迭代上限。不是








