← 所有模型

NVIDIA: Nemotron 3 Ultra

🇺🇸 NVIDIA · Nemotron 3

输入价格 $0.500 每百万 tokens NT$16.0
输出价格 $2.50 每百万 tokens NT$80.0
Context Window 1M tokens 输出上限 16K
OpenRouter 路由价 请以官方定价页为准
通过 OpenRouter 使用此模型 →

概览

NVIDIA: Nemotron 3 Ultra 是 NVIDIA 推出的大型语言模型 API,属于其 Nemotron 3 系列。输入每百万 token $0.500、输出每百万 token $2.50,处于中端区间,在能力与运行成本之间取得平衡。输出 token 的成本约为输入的 5 倍,因此以提示为主的工作负载会比以生成为主的明显便宜。极大的 1M token 上下文窗口(约 1,500 页文字)意味着整个代码库或文档集合都能一次处理,无需分块。在 Artificial Analysis 的 Intelligence Index 上得分为 48(A 级),可作为其整体推理能力相对于本站其他模型的参考指标。本页所有价格反映的是 OpenRouter 的路由费率,每日自动同步;正式投入生产前,请以提供商官方定价为准。

维度 单位 价格 (USD) 价格 (TWD) 有效自
输入 每 1M tokens $0.500 NT$16.0
输出 每 1M tokens $2.50 NT$80.0
缓存读取 每 1M tokens $0.150 NT$4.8

提供商
NVIDIA
模型家族
Nemotron 3
版本字符串
nvidia/nemotron-3-ultra-550b-a55b
状态
使用中
模态
文字
Context Window
1,000,000 tokens
输出上限
16,384 tokens

综合指标

由 Artificial Analysis 评估的跨领域能力指数 — Artificial Analysis

Agentic Index 57 S 测量于 2026-06-08
Coding Index 38 B 测量于 2026-06-08
Intelligence Index 48 A 测量于 2026-06-08

Benchmark 分数

数据来源:Artificial Analysis

AA-LCR 67.0% B 测量于 2026-06-08
GPQA Diamond 86.7% S 测量于 2026-06-08
HLE 26.6% A 测量于 2026-06-08
IFBench 81.4% A 测量于 2026-06-08
Non-Hallucination 71.5% 测量于 2026-06-08
Omniscience Accuracy 21.6% 测量于 2026-06-08
SciCode 39.9% B 测量于 2026-06-08
Tau2 83.3% 测量于 2026-06-08
TerminalBench 36.4% 测量于 2026-06-08

效能指标

实测数据,由 Artificial Analysis 每 72 小时更新 — Artificial Analysis

首 Token 延迟 1.1s 测量于 2026-06-08
输出速度 159 t/s 测量于 2026-06-08
回应时间 18.6s 测量于 2026-06-08

过去 90 天价格走势

输入 / 输出价格(USD per 1M tokens)

过去 90 天记录;每次价格变动会在此呈现

日期 维度 价格 (USD) 来源
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter
缓存读取 $0.150 OpenRouter
输出 $2.50 OpenRouter
输入 $0.500 OpenRouter

描述

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

重点摘要

以下为本页面的关键数据,供快速参考与引用。

  • NVIDIA: Nemotron 3 Ultra input 价格为 $0.5/M tokens
  • NVIDIA: Nemotron 3 Ultra output 价格为 $2.5/M tokens
  • Context window:1,000,000 tokens
  • 提供商:NVIDIA
  • 模型家族:Nemotron 3
  • 支持模态:文字
  • 数据来源:OpenRouter,每日自动更新