
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文总结了作者在LLM模型选型中的三次踩坑经历及解决方案。第一次因盲目相信Benchmark分数导致业务效果不佳;第二次因忽视推理成本和延迟导致预算超支;第三次因单点依赖导致API故障影响业务。作者提出五步选型法:1)明确业务场景需求;2)设定延迟/成本红线;3)用真实数据并行测试;4)A/B验证;5)设置多级降级策略。强调选型需平衡效果、成本和延迟,并准备备用方案。最后指出不同模型适用场景:GP
2026年5月,AI行业迎来密集更新:OpenAI的GPT-5.6进入测试,支持150万Token上下文窗口;Anthropic的ClaudeOpus4.8和Sonnet4.8相继曝光,后者跳过4.7直接发布。两大巨头还展开Codex与ClaudeCode的补贴大战,模型迭代周期从半年缩短至月度。超长上下文窗口和多模型竞争给开发者带来新机遇与挑战,需关注接口适配、编程范式转变和工具选型策略。行业正
文章摘要: 2026年,AI行业进入“智能体(Agent)时代”,技术重心从“对话式AI”转向“自主执行任务”的AgenticAI。其核心架构包括: ReAct框架:模型通过“思考-行动-观察”循环自主完成任务,结合工具调用(Function Calling)和规划策略(Plan-and-Execute/Tree of Thoughts)。 MCP协议:标准化工具调用,实现跨平台兼容性;A2A协议
谷歌在2026年I/O大会上发布免费AI模型Gemini 3.5 Flash,性能全面超越竞争对手。该模型输出速度达280token/秒,是GPT-5.5的4倍,支持100万token上下文窗口,并在编程和智能体任务中表现优异。谷歌还展示了93个AI智能体协同12小时构建操作系统的突破性成果。这一免费开放策略将重塑AI行业格局,迫使竞争对手重新评估商业模式。开发者可立即通过Gemini App免费
谷歌在2026年I/O大会上发布免费AI模型Gemini 3.5 Flash,性能全面超越竞争对手。该模型输出速度达280token/秒,是GPT-5.5的4倍,支持100万token上下文窗口,并在编程和智能体任务中表现优异。谷歌还展示了93个AI智能体协同12小时构建操作系统的突破性成果。这一免费开放策略将重塑AI行业格局,迫使竞争对手重新评估商业模式。开发者可立即通过Gemini App免费
阿里云Qoder 1.0的发布,标志着AI编程工具从"辅助"到"自主"的关键一跃。它的多Agent协作架构、需求驱动执行模式、全流程质量保障,共同构成了一套完整的自主开发工作流。但这并不意味着程序员要失业了。Qoder 1.0改变的是开发的方式,而不是开发本身——开发者从"写代码的人"转变为"定义需求和审核结果的人"。这要求开发者具备更强的系统设计能力、需求拆解能力和代码审查能力,而非仅仅关注代码
OpenAI战略转型:40亿美元成立DeployCo,收购Tomoro并发布小型化模型GPT-5.4系列,标志着从模型供应商向企业AI服务商的转变。DeployCo将提供定制化部署服务,Tomoro带来行业know-how,小型模型降低部署门槛。这一组合拳重构了AI商业化路径,将推动行业从模型能力竞争转向落地服务竞争,重塑AI咨询和基础设施市场格局。开发者需关注混合模型架构、部署工具链和企业级工程
中国AI大模型调用量连续三周全球领先,腾讯Hy3preview以2.66万亿Token周调用量登顶,环比增长210%,DeepSeek-V4-Flash位居第二。中国周调用量达7.693万亿Token,占全球28.6%,显示中国AI应用层爆发和市场渗透超预期。腾讯依托生态优势实现用户留存,DeepSeek则以技术驱动在开发者社区建立口碑。这一趋势标志着全球大模型竞争格局重塑,中国AI从技术追赶转向
摘要:MiniMax(上海稀宇科技)在2025-2026年大模型竞争中采取"多模态+MoE架构"战略,聚焦AGI时代优势。技术层面采用MoE架构实现高效推理,如MiniMax-M2模型仅10B参数却保持高性能;商业层面专注多模态融合与产品化落地,通过文本、语音、图像等跨模态交互打造应用场景。该战略以技术效率支撑产品创新,旨在通过差异化路线成为未来AGI市场的核心玩家。(149字
摘要:MiniMax(上海稀宇科技)在2025-2026年大模型竞争中采取"多模态+MoE架构"战略,聚焦AGI时代优势。技术层面采用MoE架构实现高效推理,如MiniMax-M2模型仅10B参数却保持高性能;商业层面专注多模态融合与产品化落地,通过文本、语音、图像等跨模态交互打造应用场景。该战略以技术效率支撑产品创新,旨在通过差异化路线成为未来AGI市场的核心玩家。(149字







