如果说过去两年 AI 世界的主角是模型,那么 2026 年,舞台中央正在发生一次明显转移:从模型竞争,转向基础设施竞争。

在刚刚结束的 Red Hat Summit 2026 上,红帽释放出一个强烈信号:AI时代,企业真正缺的不是更多模型,而是让模型安全、稳定、可治理地运行起来的基础设施。这家长期定义企业开源标准的软件公司,正在试图重新定义自己在 AI 时代的位置。

从 RHEL Forever(RHEL长生命周期增强包),到 Ansible Automation Platform 2.7,再到围绕 AI Agent 推出的全新平台能力,红帽的战略越来越清晰:成为企业 AI 的“可信执行层(Trusted Execution Layer)”。

在峰会期间,CSDN参与了红帽亚太区高管媒体沟通会。红帽全球副总裁兼亚太总经理 Daniel Aw、亚太区 CTO Vincent Caldeira 与亚太区技术销售负责人 Fytos Charalambides,共同透露了红帽对 AI 基础设施未来的判断。
这不仅是一场产品发布,更像是一次关于未来企业技术栈的重新定义。
在这里插入图片描述
Red Hat Summit 2026 现场

从 Linux 到 Kubernetes,再到 AI:红帽看到第三次平台迁移

红帽全球副总裁兼亚太总经理 Daniel Aw 用一个颇具历史纵深感的视角,解释了红帽为何如此坚定地押注 AI 基础设施。在他看来,过去二十多年,企业 IT 世界实际上已经经历了两次决定性的技术平台迁移,而今天,我们正站在第三次迁移的起点。

第一次迁移发生在 21 世纪初,是属于 Linux 的时代。彼时,企业计算仍深度依赖 IBM AIX、HP-UX、Solaris 等专有 Unix 系统。操作系统与硬件高度绑定,企业往往被锁定在特定厂商生态中,基础设施成本高昂,创新速度缓慢。Linux 的出现改变了这一切。Daniel 将这一阶段称为“Linux Moment”,认为 Linux 的真正价值,并不仅仅是替代了 Unix,而是实现了操作系统层面的“民主化”——企业第一次拥有了选择权和控制权。

红帽正是在这一轮浪潮中建立起自己的核心价值。它将社区版 Linux 打磨为企业可长期依赖的 Red Hat Enterprise Linux(RHEL),让开源第一次真正进入关键业务系统。从某种意义上说,红帽定义了企业如何使用开源。

第二次平台迁移,则发生在 2010 年代后期。随着云计算成熟,企业面临的新问题不再是“运行什么操作系统”,而是“如何部署和管理应用”。容器技术和 Kubernetes 的崛起,推动软件架构从传统单体应用向微服务全面转型,应用部署方式从“安装软件”变成“编排服务”,企业开始迈入云原生时代。

Daniel认为,这同样是一场由开源驱动的技术革命。

Kubernetes 解决了容器编排问题,但其复杂性也让大量企业难以直接驾驭。红帽通过 OpenShift,将 Kubernetes、开发工具链、安全策略和混合云能力整合为统一平台,把社区创新重新包装成企业可消费的产品。如今,OpenShift 已经成为红帽新的增长引擎。根据红帽披露的数据,其 OpenShift 业务年度经常性收入已突破 20 亿美元,而通过 OpenShift 实现的虚拟机增长更达到 417%。云原生平台不再只是应用开发工具,而正在成为企业数据中心新的基础设施核心。
在这里插入图片描述

而现在,Daniel认为第三次平台迁移已经到来。

这一次,推动变革的力量是 AI。

如果说 Linux 改变的是操作系统,Kubernetes 改变的是应用部署方式,那么 AI 正在改变软件本身的行为逻辑。软件不再只是执行预定义代码,而开始具备理解语言、调用工具、生成内容,甚至自主决策和行动的能力。企业软件正从“程序”演变为“智能体”。

这意味着,企业所需要的平台能力也正在发生根本变化。

他们不仅需要计算资源,更需要管理 GPU、优化推理成本、部署模型服务;不仅需要应用平台,更需要构建数据治理、知识检索和模型评估体系;不仅需要自动化工具,更需要能够管理 Agent 身份、追踪模型调用、解释智能决策的治理系统。围绕这些需求,企业开始重新思考一个核心问题:AI 的基础平台究竟应该是什么。
Daniel的答案非常明确。

正如过去 Linux 和 Kubernetes 一样,AI 时代的底层创新仍然会首先发生在开源社区,而红帽的角色,仍然是将这些快速演进的开源能力转化为企业可依赖的基础设施。

红帽正在试图建立一个覆盖 AI 全生命周期的技术平台。这一战略的底层逻辑并没有改变。

过去二十多年,红帽始终扮演着同一个角色:让社区负责创新,让企业获得可信。当行业还在讨论哪个模型更强时,红帽已经把问题推进到下一层:谁来定义 AI 时代真正的基础平台。

RHEL 的新使命:让企业既能“快”,也能“永远不动”

如果说 AI 是本届红帽全球峰会最受关注的关键词,那么另一个同样值得关注的信号,是红帽正在重新定义 Linux 在企业技术栈中的角色。

过去,企业对操作系统的期待往往是稳定、安全、可长期维护。Linux 是基础设施的“地基”,它的价值在于尽可能不被感知——只要稳定运行即可。

但在 AI 时代,这种看似稳固的逻辑正在发生变化。

一方面,越来越多企业正在加快技术迭代,希望底层平台能够快速响应新的安全威胁与业务需求;另一方面,仍有大量关键系统运行在极度保守的环境中,它们无法轻易升级,甚至根本不允许变动。对于红帽而言,这意味着企业客户正在同时提出两种截然不同、甚至相互矛盾的需求:既希望平台能够足够“快”,也希望某些系统可以“永远不动”。围绕这一现实,红帽在本届 Summit 上给出了答案:让 RHEL 同时服务这两个方向。

Daniel Aw 在媒体沟通会上提到,亚太市场尤其存在大量此类需求,特别是在金融、电信、公共部门以及关键基础设施领域。很多企业仍然运行着已经稳定多年的 Linux 平台,它们承载着核心业务,经过长期验证,不希望因为厂商生命周期结束而被迫迁移。这些系统有时甚至比软件厂商本身存在得更久。
在这里插入图片描述

为此,红帽推出了 RHEL Long-Life Add-On,内部更直观的表达是 “RHEL Forever”。它的核心理念非常简单:把企业对操作系统的控制权真正交还给客户。

在现有 RHEL 标准支持周期和延长支持周期之外,这一新增服务允许企业继续获得关键安全补丁、漏洞修复以及技术支持,而且没有预设终止时间。换句话说,只要客户希望继续运行现有系统,红帽就会继续提供支持。
这看似只是一次生命周期延长,却意味着企业基础设施管理逻辑的一次转变。

长期以来,企业软件升级往往受制于厂商规定的生命周期节奏。即使业务系统运行稳定,也可能因为操作系统停止支持而被迫进行大规模迁移,承担高昂成本和潜在风险。而“RHEL Forever”的出现,让企业可以将升级节奏与自身业务周期对齐,而不是被厂商时间表推动。

对于那些运行在边缘环境、工业设备、医疗系统,甚至国防设施中的长期工作负载而言,这种能力尤为关键。
但有意思的是,在宣布“让系统尽可能不变”的同时,红帽也在推动 Linux 向另一个方向快速演进。

在同一场沟通会上,红帽亚太区技术销售负责人 Fytos Charalambides 提到,另一类客户正在提出完全不同的诉求。他们希望更快地获得更新,更快地修复漏洞,甚至希望底层系统能够在 24 小时内完成关键安全补丁部署。
尤其是在 AI 工作负载快速增长的背景下,系统暴露面扩大,软件供应链风险增加,企业对“即时安全”的需求显著提升。

为回应这一需求,红帽推出了一项基于 Fedora Hummingbird 项目的新能力,其目标十分直接:实现 RHEL 的“零 CVE”更新能力。

借助 AI 辅助分析、安全自动化以及软件供应链验证技术,红帽正在尝试让关键漏洞能够在极短时间内完成识别、补丁生成和部署,从而让企业基础设施保持持续的高安全状态。Fytos将这种能力描述为面向那些“想跑得非常快”的客户。

这实际上揭示了企业 Linux 市场正在发生的一种分化。一部分企业希望通过长期稳定来降低风险,尽可能减少变化;另一部分企业则希望通过快速更新来降低风险,以更高频率适应变化。

看似相反的两种需求,背后却是同一个目标:控制风险。而红帽正在试图让 RHEL 同时满足这两种模式。
这也是本次 Summit 上 Linux 产品战略最值得关注的地方。RHEL 不再只是一个被动维持稳定的企业操作系统,而正在成为一个更加灵活的基础设施平台,在一个快速变化的时代,企业究竟该如何获得真正的稳定?

它给出的答案是:不是让所有系统都变快,也不是让所有系统都停留不动,而是让企业拥有选择变化节奏的权利。

AI基础设施竞争,已经从训练转向推理

过去两年,大模型产业的竞争焦点几乎始终围绕“训练”展开。

谁拥有更多 GPU,谁能训练出更大的参数规模,谁能够刷新 Benchmark 排行榜,往往决定了一家公司在 AI 赛道上的话语权。从 GPT 到 Claude,从 Gemini 到各类开源模型,行业的注意力长期集中在模型能力本身。
但在 Red Hat Summit 2026 上,红帽传递出的一个重要判断是:AI 基础设施的核心战场,正在悄然发生转移。竞争的重点,正从训练转向推理。

这背后,是企业 AI 落地逻辑的变化。

对于大多数企业而言,自主训练基础模型并不是现实选项。训练需要海量 GPU 投入、复杂的数据工程体系,以及长期积累的算法能力,这些门槛决定了只有极少数科技巨头能够参与。

但推理不同。几乎所有企业最终都需要运行模型。无论是内部知识问答、代码助手、客服智能体,还是越来越受关注的 Agent 系统,真正产生持续成本的,并不是模型训练,而是模型被反复调用的推理过程。

随着 AI 应用从实验走向生产,企业开始意识到一个更现实的问题:模型能不能用,不只取决于能力,更取决于推理成本是否可接受。这也是为什么“推理优化”正在成为 AI 基础设施的新关键词。

如今企业用户讨论 AI 时,最常提出的问题已经不再是“哪个模型最好”,而是:“这个模型运行起来要花多少钱?”

推理阶段涉及的每一次 token 生成,都会转化为实际算力消耗。模型越大,调用越频繁,成本压力就越明显。尤其是在企业级 Agent 应用逐渐兴起后,一个复杂任务可能涉及多轮模型调用、多次工具访问,以及跨模型协作,推理成本正呈指数级放大。如何提高 GPU 利用率、减少无效计算、缩短响应时间,已经成为企业 AI 基础设施设计的核心命题。

这也是红帽加速投入推理技术栈的重要原因。

Vincent透露,红帽目前已经成为 vLLM 社区最大的贡献者之一。vLLM 在当前开源 AI 推理生态中,正迅速成为事实标准之一。它解决的,是大模型部署中最现实的问题:如何让同样的 GPU,承载更多推理请求。其背后的核心能力,包括 KV Cache 优化、动态批处理(Dynamic Batching)、请求调度,以及近年来备受关注的 Speculative Decoding(推测式解码)。

简单来说,它的思路是用一个更小、更便宜的模型,提前预测大模型可能输出的内容,再由主模型进行快速验证,从而减少昂贵的大模型计算时间。这是一种典型的“用便宜算力换昂贵算力”的优化方式。

对于单次调用而言,收益或许有限,但在企业级规模下,它可能直接决定 AI 服务的商业可行性。从这个角度看,推理优化已经不只是技术问题,而是成本问题,更是业务问题。

不过,红帽对推理基础设施的理解,并不止于性能优化。

Vincent在沟通会上提到,越来越多企业客户甚至不希望自己管理 GPU。他们不想研究推理框架,不想处理模型版本,也不想维护复杂的硬件资源池。他们真正想要的,只是一个可以稳定调用的模型接口。这推动红帽进一步提出了 Model-as-a-Service 的理念。

换句话说,模型应该像数据库服务、消息队列服务一样,被封装成企业内部可直接消费的标准能力。开发团队只需要申请 API Key,调用统一 Endpoint,就可以访问组织批准使用的模型,而无需理解底层运行细节。
这种模式某种程度上像是企业内部版本的 OpenAI API。但与公共云 AI 服务不同,它允许企业保留对模型选择、数据访问、安全策略以及运行环境的控制权。

这也是红帽一贯强调的“开放选择”。企业可以根据需求选择开源模型或商业模型,选择本地部署或混合云部署,而底层推理平台保持一致。

从更大的产业趋势看,这种变化也意味着 AI 竞争逻辑正在发生转折。

过去,行业追求的是训练出“最强模型”;如今,越来越多企业开始关注:如何让模型被更便宜地调用,如何让推理更高效,如何让智能服务真正进入生产环境。模型能力决定了 AI 的上限。而推理基础设施,正在决定 AI 应用能否规模化。

红帽选并不试图成为下一家模型公司,而是希望像过去定义 Linux 和 Kubernetes 一样,在 AI 时代重新定义模型运行的平台层。

从训练转向推理,并不意味着模型创新结束。而是意味着,AI 正在从“研究问题”,变成“工程问题”。

Agent时代,企业真正缺的,是一套可信的“执行层”

如果说推理正在成为 AI 基础设施的新战场,那么在 Red Hat Summit 2026 上,另一个被频繁提及的关键词,则是 Agent。

从大模型到智能体,几乎已经成为整个行业默认的发展路径。过去一年,无论是 OpenAI、Anthropic,还是微软、Google,都在不断推动模型从“生成内容”走向“执行任务”。软件不再只是回答问题,而是开始尝试理解目标、拆解步骤、调用工具,并最终完成行动。对于企业而言,这意味着 AI 正在从辅助工具,逐渐演变为真正能够参与业务流程的执行主体。

但问题也随之出现。模型可以推理,并不意味着企业就能放心让它行动。

红帽亚太区 CTO Vincent Caldeira 提出了一个颇为直接的问题:企业如何确保 Agent 的行为始终处于可控范围之内?这实际上点出了 Agent 落地过程中最核心的矛盾。Agent 的运行逻辑却天然带有概率性,它可能根据上下文做出不同判断,也可能调用不同工具,甚至在复杂任务中自主调整执行路径。这种“非确定性”,让企业既兴奋,又警惕。它意味着更高的自动化潜力,也意味着更大的治理挑战。

红帽认为,当前企业并不缺模型,也不缺构建 Agent 的工具链,真正缺少的是一套能够让 Agent 安全运行的“执行层”。这也是红帽在 AI 产品布局中逐渐强化的一条主线。

Vincent提到,未来企业运行 Agent 时,必须能够清晰回答几个关键问题:这个智能体为什么做出某个决定?调用了哪些外部工具?访问了哪些企业数据?哪些动作经过了人工审批?整个决策路径是否可以被完整回溯?这些能力看似属于“管理功能”,却可能是决定 Agent 能否真正进入企业核心业务流程的前提。Agent 不再只是一个模型实例,而更像一个需要被纳入治理体系的“数字员工”。

与此同时,在本届 Summit 上,Ansible 的定位也发生了微妙变化。过去,它是企业自动化工具,用于配置管理和流程编排;而现在,它正在成为 Agent 执行动作的“确定性引擎”。

AI 负责理解和决策。Ansible 负责执行和控制。必要时,人类介入审批。这种模式构成了一种更加符合企业需求的协作关系:不是让 Agent 完全自治,而是在智能推理、人类判断和自动化执行之间建立清晰边界。某种意义上,这正是红帽对 Agent 时代企业基础设施的理解。

另一个更基础的问题:企业如何真正信任 Agent。在 Agent 时代,企业真正需要的,不只是更强的智能,而是一套能够承载智能系统长期运行的可信平台。红帽对此给出的答案,是把自己长期积累的自动化能力重新升级为 Agent 时代的执行基础设施。

在本届大会上,Ansible 的角色变化尤为明显。过去,它是企业熟悉的自动化平台,用于配置管理、流程编排和运维任务执行;而现在,它正在成为连接 AI 决策与企业系统之间的关键桥梁。

红帽试图建立一种新的协作模式:由 AI 负责理解需求和生成行动方案,由人类进行必要审批,再由 Ansible 执行确定性的系统操作。这种模式的意义在于,它并不试图让 Agent 完全自治,而是通过自动化平台为智能系统建立边界、权限和可追踪的执行机制,让企业能够在保留控制权的前提下释放 AI 的效率价值。

从某种意义上说,Ansible 正在从“Automation Platform”演变为一种新的 AgentOps 平台——帮助企业管理的不只是服务器和应用,而是越来越多正在参与业务流程的智能体。

从 Agent 的执行治理,再到开源生态的持续演进,红帽试图回答的,其实始终是同一个问题:当 AI 从实验室走向企业核心系统,谁来提供值得信赖的基础设施。
在这里插入图片描述

AI进入生产时代,红帽试图重新定义自己

纵观整个 Red Hat Summit 2026,不难发现,红帽正在尝试完成一次新的身份转换。

与当下大多数 AI 公司不同,红帽并没有选择加入模型能力的直接竞争。它既不追逐更大的参数规模,也不试图打造自己的通用大模型,而是将关注点放在一个更加基础、却也更加关键的问题上:当 AI 真正进入企业生产环境,谁来提供支撑其稳定运行的底层平台。

从延长 Linux 生命周期的 “RHEL Forever”,到面向快速安全响应的 Zero-CVE 能力;从围绕推理优化构建模型服务平台,到为 Agent 建立可观察、可治理的执行框架;从帮助企业管理跨云基础设施,到回应 Sovereign AI 对控制权和自主性的诉求,红帽几乎所有的技术布局,都在指向同一个目标——成为企业 AI 的可信执行层。
这或许不是 AI 产业中最受关注的位置,却可能是智能系统真正走向规模化落地所必须补齐的一层。这意味着,AI 正在从“能力验证”走向“生产验证”,而基础设施的重要性也因此被重新放大。

从这个意义上看,Red Hat Summit 2026 释放出的最重要信号,也许并不是某一个具体产品的发布,而是红帽对 AI 基础设施未来的一种判断:模型定义智能的高度,而基础设施决定智能能否真正成为生产力。

AI 进入生产时代之后,红帽希望再次成为那个让下一代技术真正落地的关键推动者。

Logo

加入「COC·上海城市开发者社区」,成就更好的自己!

更多推荐