logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

构建多模态 AI Agent 的噩梦:我为什么放弃了直连所有模型

上个月我帮一个客户做了一个 AI 数字人 Agent,需要同时调用 LLM 做对话、图像生成做表情、视频生成做动作、语音合成做配音。光是对接这四个模型的 API,我就写了 1000 多行代码,而且 bug 层出不穷。最崩溃的是调试的时候:用户发了一句话,Agent 要依次调用 4 个模型,只要其中一个出问题,整个流程就崩了。我要挨个查每个 API 的请求和响应,有时候一个 bug 要查一下午。直到

文章图片
#人工智能
2026 年全球 AI 大模型三强格局:ChatGPT 龙头稳固,Claude 爆发式增长,Gemini 陷入增长困局

更关键的是,商业化表现严重不及预期,谷歌 2026 年日均约 5 亿美金的 AI 巨额投入,与 Gemini 极低的营收基数形成鲜明反差,即便坐拥全球顶级的算力与技术储备,也始终未能打破 ChatGPT 与 Claude 构建的商业化壁垒,陷入了 “流量大、留存弱,投入高、回报低” 的尴尬局面。截至 2026 年 3 月,ChatGPT 移动端月活跃用户达到 9.61 亿,距离 10 亿大关仅一步

文章图片
#人工智能
到底了