MiniMax M3 專題：1M context、首週 $0.30/M，coding agent 價格戰升級

MiniMax M3 把 1M context、原生多模態、coding agent benchmark、OpenRouter 路由與首週 50% API 折扣放在同一個產品裡。它不是直接取代 Claude，而是在壓低長任務 agent 的價格下限。

MiniMax 在 2026-06-01 發布了 MiniMax M3。重點不是「又一個新模型」，而是它把 1M tokens context window、原生文字/圖片/影片理解、coding agent 定位，以及首週 API 折扣後的 $0.30/M input、$1.20/M output 放在同一條產品線裡。

這讓 M3 很適合放進 DeepSeek、MiMo V2.5 之後的價格戰脈絡來看。它不一定能直接取代 Claude Code 或 Cursor 裡常用的高價模型；更實際的問題是：M3 能不能成為長 context planning、程式碼庫問答、批量 agent loop 和多模態開發工作流裡的低價路由？

1. 為什麼 M3 不只是發布新聞

MiniMax 的模型頁把 M3 定位為 coding 與 agentic frontier model，基於 MiniMax Sparse Attention，最高支援 1M context，並保證至少 512K tokens。它也強調 M3 是原生多模態：文字、圖片、影片都可以作為輸入，而這個 text model 的輸出仍然是文字。

這個組合重要，是因為 coding agent 的 token 消耗方式和聊天機器人完全不同。真正的 agent 會把 repo context、指令、日誌、diff、工具輸出、截圖和失敗嘗試都放進迴圈。一個模型如果短 prompt 很便宜，但長 prompt 很貴或不穩定，對 agentic work 來說就不是真的便宜。

MiniMax 也把 M3 的敘事放在多步驟工作，而不是單輪補全。官方部落格列出 SWE-Bench Pro、Terminal-Bench 2.1、 MCP Atlas、論文復現、CUDA kernel 優化等內部測試結果。這些數字可以引用，但要當作廠商公布 benchmark，不能替代自己的 repo eval。

2. 價格很好，但分層很重要

價格上最容易看錯的是：M3 對一般輸入長度和超長輸入長度分開計價。在 MiniMax pay-as-you-go 頁面，截至 2026-06-05，standard service tier 的 M3 是這樣列的：

輸入長度	Input	Output	Cache read	備註
≤512K input tokens	$0.30/M	$1.20/M	$0.06/M	首 7 日 50% off；原價是 $0.60/$2.40/$0.12。
>512K input tokens	$1.20/M	$4.80/M	$0.24/M	上線初期供應有限，主要面向超長 prompt。

OpenRouter 也把 MiniMax M3 標成 50% off，價格是 $0.30/M input、$1.20/M output，並列出 1M context。對已經用 aggregator routing 的團隊來說很方便，但真正跑量前仍要對照 MiniMax 官方 API 條款，因為折扣、cache 行為、長 context 限制可能不完全一樣。

MiniMax 也在 M3 發布時更新 Token Plan：Plus $20/月、Max $50/月、Ultra $120/月。官方部落格稱三檔大約對應 1.7B、5.1B、9.8B 的月度 M3 token 用量。對個人開發者和小團隊來說，這可能比 API 表更重要；但前提是工具整合穩定，而且 quota 規則真的符合你的工作方式。

3. 1M context 和多模態真正買到什麼

1M context 不是讓你每次都把整個 monorepo 塞進去。它真正買到的是：模型不必太早忘掉有用的工作狀態。好的 M3 測試案例應該是長但有結構的輸入：repo map、設計文件、失敗日誌、選中的原始碼、截圖、API trace，再加上清楚的目標任務。

原生多模態尤其適合跨越「程式碼」和「產品狀態」的開發任務。例如：讓 agent 看 UI 截圖後找出相關 CSS，對比生成圖表和測試期望，或從產品 demo 的影片幀裡整理 bug report。不要把這裡的「multimodal」理解成圖片或影片生成； M3 text model 的定位是文字輸出，輸入可以包含文字、圖片和影片。

Cache 價格是另一個槓桿。Coding agent 經常重複發送同一份 repo summary、system prompt 和任務規則。如果 cache hit 穩定，重複輸入的成本會明顯下降；如果 cache hit 率不好，標題價格就會低估真實帳單。

4. M3 在 M2.5、M2.7 之後的位置

M2.5 和 M2.7 已經讓 MiniMax 在低價 coding 與 agent 實驗裡變得有存在感。M3 的不同點在於 MiniMax 同時推三件事：更強的 coding-agent benchmark、更大的 context 敘事、原生多模態輸入。這更像新旗艦路線，而不是單純小改版。

代價是 M3 不一定永遠是最便宜的 MiniMax 路徑。官方 API 頁面仍然保留 M2.5 和 M2.7，一些高頻、純文字任務的 cache/read 經濟性可能仍然有吸引力。如果你的任務只是簡單抽取或分類，舊路線仍可能勝出；如果任務包含多步驟 repo 工作、長日誌、截圖或工具密集 planning，M3 才是優先測試的模型。

還有一個 open-weight 限制需要講清楚。MiniMax 把 M3 稱為 open-weight model，產品頁也連到 Hugging Face 和 GitHub。但截至本文撰寫時，公開 GitHub repo 仍寫著 M3 is coming，也沒有發布 release。換句話說， self-hosting 可以先觀察，但不要在權重和部署文件真正上線前，把它當成 production-ready 預算方案。

5. 能不能替代 Claude 的 coding 路由

更好的說法是「路由選擇」，不是「替代」。Claude、GPT、Gemini、DeepSeek、MiMo、MiniMax 可以在同一個工程工作流裡分工。當失敗成本很高，例如架構調整、安全敏感修改、高風險遷移或最終 review，premium model 仍然有價值。M3 更適合測試在成本、 context 和迭代次數占主導的環節。

工作負載	M3 適配度	原因
程式碼庫問答與 planning	很值得測	長 context 和較低 input 成本比完美 edit quality 更重要。
批量重構草稿	值得測試	便宜迭代有幫助，但最終 diff 仍要測試和 review。
帶截圖的 UI bug triage	有潛力	原生圖片輸入可以把視覺狀態接回原始碼。
安全敏感的生產修改	謹慎使用	廠商 benchmark 不能替代本地 eval、規則檢查和 review gate。

MiniMax 模型頁明確列出 API integration、AI coding tools、MiniMax Code 和未來 local deployment 等路徑。但接第三方工具時，要確認具體協議支援：OpenAI-compatible、Anthropic-compatible、tool calling、streaming、 reasoning fields、patch application 都會影響 coding agent 的真實可用性。

6. 採用前檢查清單

開跑前同時看 MiniMax API 與 OpenRouter 即時價格；首週折扣有時限。
把 ≤512K input 和 >512K input 的任務分開算，因為後者價格更高。
用真實 agent session 測 cache hit rate，不要只看一次性 prompt。
做一個小型內部 eval：程式碼庫問答、一次重構、一個 failing test、一個截圖驅動 bug。
高風險 patch 保留 premium model 最終 review 路由。
M3 權重和部署文件真正發布前，不要把 self-hosting 當成已落地方案。

實用結論是：MiniMax M3 讓「低價長 context coding agent」第一次像一個嚴肅採購品類。它不會讓 Claude 或 GPT 從高風險工作裡消失，但它給 exploration、planning、多模態 triage 和高頻 agent loop 增加了一條新路線。

本文由 Allen Pan 撰寫。如有勘誤或想交流，歡迎來信 allen@xyzsleep.com.