NVIDIA推出Nemotron 3 Nano Omni模型,多模態推理效率提升9倍
NVIDIA 在 X 平臺發文表示,今日推出開源多模態模型 Nemotron 3 Nano Omni。該模型採用 30B-A3B 混合專家架構(MoE),支持 256K 上下文,可統一處理視頻、音頻、圖像及文本輸入。與同類交互水平的開源全能模型相比,該模型吞吐量提升達 9 倍,大幅降低推理成本並提高擴展性。目前 Nemotron 3 Nano Omni 已在 Hugging Face、OpenRouter 及 NVIDIA NIM 上線,並獲得 Aible、Applied Scientific Intelligence、H Company 等企業採用。