同时关联该项目与事件的快讯
知情人士称,英伟达开始向中国客户推销其首款独立中央处理器(CPU)产品 Vera。该芯片专为 Agentic AI(自主智能体)系统设计,目前已进入量产阶段,标志着英伟达正尝试通过 CPU 产品进一步拓展中国市场。消息人士称,部分中国客户已对 Vera 表现出兴趣。其中一家大型中国云计算公司计划采购 300 余台搭载双 Vera CPU 的服务器进行测试,并将在测试完成后决定是否扩大采购规模。Vera 基于 Arm Holdings 架构打造,是英伟达首次推出的独立 CPU 产品。英伟达此前表示,Vera 在 AI 智能体相关计算任务中的性能可达到竞争对手同类产品的 1.8 倍,并预计该产品将在本财年结束前(截至明年 1 月底)贡献约 200 亿美元收入。报道指出,随着 AI 行业重心逐步从模型训练转向推理计算(Inference),CPU 与定制芯片正获得更多关注。Vera 也使英伟达直接与长期主导服务器 CPU 市场的 Intel 和 Advanced Micro Devices(AMD)展开竞争。知情人士表示,由于美国对高端 GPU 出口实施严格限制,相较于 GPU 产品,CPU 在中国市场面临的监管障碍相对较小。目前部分中国客户计划先在海外数据中心部署 Vera 芯片进行测试。与此同时,软件生态兼容性以及现有国产 AI 芯片部署体系,仍可能影响 Vera 后续的大规模采用。(Reuters)
据 Tech Funding News 报道,AMD 首席执行官 Lisa Su 于伦敦科技周宣布,公司将在未来五年内向英国 AI 基础设施投资最高 20 亿英镑,涵盖国家超算基础设施建设及高校研究合作。与此同时,AMD 与伦敦 UCL 衍生初创公司 Oriole Networks 合作,依托英国政府 5000 万英镑 ARIA 推理扩展实验室项目,部署全球首个大规模纯光子网络 AI 系统。该系统以 Oriole 的 PRISM 光子网络平台搭配 AMD Instinct GPU 及 EPYC CPU,通过彻底移除网络核心中的电子开关,将核心网络能耗降低 81%,GPU 闲置时间从 60% 压缩至 1% 以下。
NVIDIA 在 X 平台发文表示,今日推出开源多模态模型 Nemotron 3 Nano Omni。该模型采用 30B-A3B 混合专家架构(MoE),支持 256K 上下文,可统一处理视频、音频、图像及文本输入。与同类交互水平的开源全能模型相比,该模型吞吐量提升达 9 倍,大幅降低推理成本并提高扩展性。目前 Nemotron 3 Nano Omni 已在 Hugging Face、OpenRouter 及 NVIDIA NIM 上线,并获得 Aible、Applied Scientific Intelligence、H Company 等企业采用。
据韩联社报道,SK 电信宣布与英国芯片设计公司 Arm 及韩国 AI 芯片初创企业 Rebellions 签署三方谅解备忘录(MOU),共同开发 AI 数据中心推理服务器解决方案。 根据协议,三方将结合 Arm 新发布的 AGI CPU与 Rebellions 预计于今年第三季度推出的 AI 加速芯片 RebelCard,联合开发 AI 推理服务器,并在 SK 电信的 AI 数据中心进行测试与验证。其中,Arm AGI CPU 针对高密度推理环境与大规模 AI 部署优化,RebelCard 则专为大规模 AI 推理设计。