红帽:将开放创新精神注入AI基础设施
CBINEWS
责任编辑:邹大斌
电脑商情在线
时间:2025-11-07 17:38
红帽 AI 开源 vLLM
生成式AI的兴起不仅激活了整个AI市场,也催生了一个新术语:“AI Infra”,即支撑AI应用所需的底层技术栈。红帽最早通过OpenShift引入对AI工作负载的支持,迈入“AI Infra”领域;随后在去年正式推出OpenShift AI,并于今年发布AI推理服务器(AI Inference Server)。如今,红帽已成为AI基础设施市场中不可忽视的重要参与者。
“我们的目标是支持任意模型、任意加速器、任意云——简而言之,根据您的需求构建人工智能。”红帽全球副总裁兼大中华区总裁曹衡康(Victor Tsao)在近日举行的2025红帽论坛上这样表示。

构建下一代云原生AI基础设施
企业正在迅速拥抱AI技术。IDC最近的一项调查显示,约70%的亚太地区企业预计,智能体AI(Agentic AI)将在未来18个月内颠覆现有商业模式;同时,71%的企业计划在未来18个月内大力投入生成式AI的研发与应用。
市场需求是技术演进的最佳驱动力。随着AI应用的普及,企业对基础设施升级的需求日益增强,新一代云原生AI基础设施已成为关注的焦点。为响应这一趋势,红帽正将容器化、性能优化与硬件加速整合为统一的创新平台,为AI应用落地提供有力支撑。
今年10月发布的红帽AI 3正是这样一个平台。它集成了红帽AI推理服务器、红帽企业Linux AI(RHEL AI)以及OpenShift AI的最新成果,能够有效简化大规模高性能AI推理的复杂性,帮助企业更顺利地将工作负载从概念验证推进至生产阶段,并提升AI应用相关的协作效率。
其中的红帽AI推理服务器引起广泛的关注。它整合了热门的开源分布式推理框架vLLM,并扩展了对更多模型的支持。为进一步推动vLLM的技术迭代,红帽还推出了开源项目llm-d。llm-d作为一个分布式推理框架,不仅支持与K8s无缝集成,还将智能生成式AI调度引入K8s,显著提升模型性能与GPU硬件利用率,同时提供“模型即服务”能力。
“自红帽成立以来,开源一直是我们一切工作的核心理念。在AI领域,我们同样坚守这一信念。”曹衡康强调。
红帽在开源领域的领导地位及其强大的生态系统,也使其能够助力企业在分布式环境中高效部署和优化AI应用。以AI推理服务器为例,作为一个软件栈,它仍需服务器硬件的支持。为此,红帽与戴尔、联想等主流服务器厂商以及多家芯片企业展开合作。在今年的红帽论坛上,国产GPU厂商沐曦就现场演示了基于红帽推理服务器与沐曦MIM(MetaX Inference Microservice)开发的多个AI应用,运行画面流畅。
曹衡康透露,沐曦获得了红帽总部提供的包括测试与认证在内的全面技术支持,是由总部与中国本地技术团队共同协作完成的。
发布全球首个车用安全操作系统
除AI之外,红帽在汽车领域的布局同样引人注目。本次论坛上,红帽正式发布了ASIL级车用安全操作系统。该系统基于成熟的红帽企业Linux(RHEL)平台构建,填补了开源系统在汽车领域的空白。这不仅是全球首个符合ASIL安全等级的开源Linux系统,也标志着软件定义汽车(SDV)愿景迈出关键一步。
红帽中国汽车操作系统首席代表姜垚指出,随着智能网联汽车的快速发展,自动驾驶已成为行业趋势。在此过程中,对AI模型与工具链的需求日益增长,封闭式、黑盒式的操作系统已无法满足AI工具与应用多样化的发展需求。此时,Linux及开源技术的优势在汽车行业愈发凸显。
红帽的竞争力不仅在于操作系统本身,更在于其能够提供安全的操作系统以及一套完整的产品链,充分满足车企的需求。
“红帽能够提供从云端设计、虚拟化开发到量产上车的全周期统一操作系统。该系统原生支持容器化研发,可在同一SoC上高效隔离座舱与智能驾驶等不同安全等级的应用,契合‘舱驾一体’的技术趋势。”姜垚表示。
姜垚透露,目前全球已有不少车企与红帽展开合作,其中包括多家中国车企。值得注意的是,中国车企在技术落地节奏上普遍领先欧美市场两年以上。
结语
随着生成式工作负载不断增长,AI应用正加速与容器负载融合。红帽在持续增强云原生基础设施能力的同时,也将开源理念拓展至AI领域,致力于降低AI创建与训练的门槛,进一步推动AI技术的普及与应用。
