
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在AI大模型的发展史上,有一个系列的出现,彻底打破了人工智能“专用化”的局限,将“通用人工智能(AGI)”从概念走向现实,重新定义了人类与AI的交互方式,它就是OpenAI研发的GPT系列。不同于后续聚焦原生多模态的Gemini、深耕企业级合规的Claude,GPT系列以“文本优先、通用适配、持续迭代”为核心,凭借突破性的Transformer架构应用与人类反馈强化学习技术,开创了通用大模型的全新
在上一篇 AI 大模型学习日志中,我们对阿里通义千问 Qwen 系列完成了全维度拆解,该系列以 “闭源端深耕产业落地、开源端布局全球生态” 的双线策略,成为国内大模型全球化发展的典型样本。而在巨头扎堆的大模型赛道中,有一家无大厂背景的初创企业,凭借对高阶推理能力与代码开发能力的极致打磨,走出了一条差异化突围之路 —— 它不追求全场景的 “全能型” 定位,也不盲目堆砌参数规模,而是将 “深度推理”
MCP(模型上下文协议)是AI应用连接外部工具和数据源的标准化协议,旨在解决Agent工程化落地中的接口统一问题。它采用Host-Client-Server架构,通过标准化工具、资源和提示模板的描述与交互方式,使AI应用能以统一协议接入各类外部系统。MCP不仅解决了工具调用问题,更关注上下文管理和安全边界,为Agent提供了连接真实世界的可靠接口。虽然不能解决所有工程问题,但MCP通过降低连接成本
在上一篇AI大模型学习日志中,我们深度拆解了OpenAI的GPT系列,它以Transformer架构为基础,开创了通用闭源大模型的先河,凭借强大的文本生成与后期多模态融合能力,成为消费级与开发者场景的标杆。但GPT的多模态能力并非原生设计,而是通过后期模块拼接实现,存在模态协同性不足、推理效率偏低的短板。而今天我们要拆解的,正是打破这一局限、重新定义多模态大模型的核心玩家——Google Gemi
过去一年,很多团队把注意力都放在 Prompt、RAG、Workflow 和模型选型上。但真到项目落地时,最常见的失败场景却不是“模型不会”,而是“模型会一点,但系统兜不住”:它能开始做事,却容易跑偏;能调用工具,却不稳定;能改代码,却很难持续把复杂任务做完。也正因为如此,Harness Engineering 在 2026 年开始迅速进入开发者视野。这个概念的重点,不是再给模型多加几句提示,而是
我们日常使用的 ChatGPT、Claude、豆包等 AI 产品,早已从「聊天机器人」进化为能写代码、查数据、做规划、甚至自主完成复杂任务的生产力工具。而支撑这一切的,正是一套完整的技术链路 —— 从底层的模型底座,到信息处理的基本单位,再到人机交互的指令体系、外部能力的标准化拓展,最终落地为能自主干活的智能系统。
我们日常使用的 ChatGPT、Claude、豆包等 AI 产品,早已从「聊天机器人」进化为能写代码、查数据、做规划、甚至自主完成复杂任务的生产力工具。而支撑这一切的,正是一套完整的技术链路 —— 从底层的模型底座,到信息处理的基本单位,再到人机交互的指令体系、外部能力的标准化拓展,最终落地为能自主干活的智能系统。
在前11篇AI大模型学习日志中,我们已完成全球大模型赛道的全景式拆解:从开创通用AI范式的OpenAI GPT、原生多模态领跑者Google Gemini,到企业级合规标杆Claude、全球开源事实标准Llama;从国内C端国民级产品豆包、政企与开源双线领跑的通义千问,到初创硬核突围的DeepSeek、知识增强标杆文心一言、长文本垂直王者Kimi,再到产学研融合典范智谱GLM。我们完整覆盖了海外与
在上一篇AI大模型学习日志中,我们完整拆解了百度文心一言ERNIE系列,它凭借知识增强与政企深耕的独特路径,成为国内政企服务领域的核心力量,为大模型的行业落地提供了成熟范本。而在巨头与细分赛道玩家同台竞技的格局中,有一款模型走出了“开源+长文本+智能代理”的差异化路线——它不追求全场景全能,不堆砌参数噱头,而是以静默迭代的务实风格,将长文本处理、Agent集群能力做到行业顶尖,同时以低成本开源策略
在上一篇AI大模型学习日志中,我们完整拆解了深度求索DeepSeek系列,这家初创公司凭借对推理与代码能力的极致深耕,成为开源赛道的硬核实力派,为初创企业的差异化突围提供了可复制的思路。而在国内大模型赛道,有一款产品堪称“本土先行者”,它不仅是国内最早公开落地的通用大模型之一,更凭借百度数十年的知识图谱与NLP技术积累,走出了“知识增强+政企深耕”的独特路径,成为国内政企服务与知识服务领域的核心力







