NVIDIA: Nemotron 3 Ultra
🇺🇸 NVIDIA · Nemotron 3
输入价格 $0.500 每百万 tokens NT$16.0
输出价格 $2.50 每百万 tokens NT$80.0
Context Window 1M tokens 输出上限 16K
OpenRouter 路由价 请以官方定价页为准
概览
NVIDIA: Nemotron 3 Ultra 是 NVIDIA 推出的大型语言模型 API,属于其 Nemotron 3 系列。输入每百万 token $0.500、输出每百万 token $2.50,处于中端区间,在能力与运行成本之间取得平衡。输出 token 的成本约为输入的 5 倍,因此以提示为主的工作负载会比以生成为主的明显便宜。极大的 1M token 上下文窗口(约 1,500 页文字)意味着整个代码库或文档集合都能一次处理,无需分块。在 Artificial Analysis 的 Intelligence Index 上得分为 48(A 级),可作为其整体推理能力相对于本站其他模型的参考指标。本页所有价格反映的是 OpenRouter 的路由费率,每日自动同步;正式投入生产前,请以提供商官方定价为准。
| 维度 | 单位 | 价格 (USD) |
|---|---|---|
| 输入 | 每 1M tokens | $0.500 |
| 输出 | 每 1M tokens | $2.50 |
| 缓存读取 | 每 1M tokens | $0.150 |
- 提供商
- NVIDIA
- 模型家族
- Nemotron 3
- 版本字符串
- nvidia/nemotron-3-ultra-550b-a55b
- 状态
- 使用中
- 模态
- 文字
- Context Window
- 1,000,000 tokens
- 输出上限
- 16,384 tokens
综合指标
由 Artificial Analysis 评估的跨领域能力指数 — Artificial Analysis
Agentic Index 57 S 测量于 2026-06-08
Coding Index 38 B 测量于 2026-06-08
Intelligence Index 48 A 测量于 2026-06-08
Benchmark 分数
数据来源:Artificial Analysis
AA-LCR 67.0% B 测量于 2026-06-08
GPQA Diamond 86.7% S 测量于 2026-06-08
HLE 26.6% A 测量于 2026-06-08
IFBench 81.4% A 测量于 2026-06-08
Non-Hallucination 71.5% 测量于 2026-06-08
Omniscience Accuracy 21.6% 测量于 2026-06-08
SciCode 39.9% B 测量于 2026-06-08
Tau2 83.3% 测量于 2026-06-08
TerminalBench 36.4% 测量于 2026-06-08
效能指标
实测数据,由 Artificial Analysis 每 72 小时更新 — Artificial Analysis
首 Token 延迟 1.1s 测量于 2026-06-08
输出速度 159 t/s 测量于 2026-06-08
回应时间 18.6s 测量于 2026-06-08
过去 90 天价格走势
输入 / 输出价格(USD per 1M tokens)
过去 90 天记录;每次价格变动会在此呈现
| 日期 | 维度 | 价格 (USD) | 来源 |
|---|---|---|---|
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter | |
| 缓存读取 | $0.150 | OpenRouter | |
| 输出 | $2.50 | OpenRouter | |
| 输入 | $0.500 | OpenRouter |
描述
NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...
重点摘要
以下为本页面的关键数据,供快速参考与引用。
- NVIDIA: Nemotron 3 Ultra input 价格为 $0.5/M tokens
- NVIDIA: Nemotron 3 Ultra output 价格为 $2.5/M tokens
- Context window:1,000,000 tokens
- 提供商:NVIDIA
- 模型家族:Nemotron 3
- 支持模态:文字
- 数据来源:OpenRouter,每日自动更新