
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章揭示了AI智能体落地的真相:90%工作是工程架构设计,仅10%涉及大模型本身。详细拆解了智能体落地的14个层次,包括算力、基础设施、数据库、ETL、基础模型等,强调企业需全链路打磨而非单点突破。大模型虽是点睛之笔,但缺乏前期工程支撑,智能体难以真正落地成功。越来越多的企业正在尝试把 AI 智能体真正落地,我们会发现一个有趣的规律:90% 的工作其实是工程架构设计,只有 10% 才是大模型本身的

北京时间周五凌晨,美国初创公司OpenAI举行直播活动,发布最新大模型GPT-4.5,作为预览研究逐步向用户开放。由于过去几周AI产业发生的惊天巨变,所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示,作为“规模法则”(通过加码算力和数据规模,来拓展无监督学习)指引下的产物,GPT-4.5具备更加广泛的知识库、对人类意图理解的能力更强,同时“情商”也会更高。

自 ChatGPT 发布以来,科技界掀起了一场大模型的竞争热潮。数据成为新生产要素,算力成为新基础能源,大模型则成为新生产工具,各行各业从“+A”向“AI+的转变已势不可挡。随着模型参数量从千亿迈向万亿,模型能力更加泛化,大模型对底层算力的诉求进一步升级,超万卡集群成为这一轮大模型基建军备竞赛的标配超万卡集群将有助于压缩大模型训练时间,实现模型能力的快速迭代,并及时对市场趋势作出应对。

还记得2022年11月30日Chat-GPT3.5发布吗?短短5天的时间,其用户量就飞速突破了100万。时至今日,从第三方数据显示,2025年12月统计的月活跃人数达到了惊人的9.1亿。从Chat-GPT刚开始的爆发式传递增长,也顺带燃起了全世界人们对AI追求的热情,更加速了国产AI大模型的飞速发展!随着近几年AI大模型的不断发展, 我们国内的大模型开发公司或机构也犹如雨后春笋般增长。尽管存在巨大

Dify 是一个开源的大语言模型(LLM)应用开发平台,融合了后端即服务(BaaS) 和 LLMOps 理念,为从原型设计到生产部署提供全流程支持,如图5.15所示。它采用分层模块化架构,分为数据层、开发层、编排层和基础层,各层解耦便于扩展。Dify 对模型高度中立且兼容性强:无论开源或商业模型,用户都可通过简单配置将其接入,并通过统一接口调用其推理能力。其内置支持对数百种开源或专有 LLM 的集

文章介绍智能体工程这一新兴学科,解决AI智能体从Demo到生产的工程挑战,包括10大工程维度:交互、模型、推理核心、上下文、记忆、知识、集成、可观测性、安全和治理工程。随着Agent应用走向真实业务,工程层面的挑战日益重要,智能体工程将成为2026年热点,决定Agent能否进入生产环境并实现规模化。技术层面的突破让AI智能体(Agent)成为当前绝对的AI热点。

2025年即将过去,作为一名深耕RAG技术的算法工程师,我想和大家聊聊这一年RAG技术的真实状态——不是那些震惊体标题下的"RAG已死",也不是各种PPT里的宏大叙事,而是我在实际落地中观察到的技术演进、踩过的坑,以及对2026年的真实判断。技术本身没有对错,关键在于是否用对了地方。下期分享: 7 种必须了解的企业落地RAG 架构回看这一年,RAG经历了从狂热到冷静,技术本身在成熟,但大家的心态也

前言,智算中心核心任务是承载AI大模型的训练及推理等,进而为各行各业提供便捷、高效、领先和普惠的多元化“算力服务”,大模型作为智算时代的核心“产物”被大家广泛关注,从技术迭代和应用角度可细分为三个类型分别为基础大模型、行业大模型以及场景大模型(垂类大模型)。三者之间的区别和联系是什么?非专业领域朋友如何快速记住它们特点呢?今天我们简单聊聊!

AG-UI协议就像是给AI应用装上了“智能导航”,让前后端之间的沟通更顺畅、更高效。开发者不用再纠结底层通信的问题,可以专心做真正重要的事——设计能帮用户解决问题的功能。对用户来说,AI变得更懂自己,不再是冷冰冰的工具,而是贴心的助手。不管你是经验丰富的AI开发者,还是刚入门的新手,AG-UI协议都值得你了解一下。它正在带你走进一个更智能的未来,一起探索AI的无限可能。

其它内容请读者自行下载PDF去学习,这里就不一一展示了。








