首頁>2026-02-06 13:25:42
來源:今報在線
近日消息,階躍星辰開源 Agent 基座模型 Step 3.5 Flash 上線僅兩天成功登頂 OpenRouter 平臺 Trending 榜單。該榜單排名來自全球知名大模型聚合平臺 OpenRouter 數(shù)據(jù),數(shù)據(jù)基于全球開發(fā)者與用戶的實際模型調用量,直觀反映出模型在真實應用場景中的受歡迎程度與市場接受度。

階躍星辰 Step 3.5 Flash 榮登 OpenRouter Trending 榜首,不僅驗證了該模型作為技術黑馬在高吞吐與復雜推理場景下的強勁實力,更彰顯了其作為兼具極致性能與穩(wěn)定性的實戰(zhàn)首選地位作為面向實時 Agent 工作流場景的模型,Step 3.5 Flash 在推理效率上表現(xiàn)突出,最高推理速度可達每秒 350 個 token。該模型款稀疏混合專家(MoE)架構,在保持較為精巧的1960總參數(shù)量的同時,每個 token 在處理過程中僅需激活約 110 億個參數(shù),在保障模型性能的同時實現(xiàn)運行效率的優(yōu)化,從而彌合前沿級智能體智能與計算效率之間的鴻溝。
在官方發(fā)布的Step 3.5 Flash Tech Report里顯示,該模型聚焦于構建智能體的精準推理能?以及快速可靠的執(zhí)行效率。Step 3.5 Flash 通過交錯的 3:1 滑動窗口/全注意力機制(Sliding Window/Full Attention)和多 Token 預測(MTP-3)進行優(yōu)化,以最小化多輪智能體交互的延遲和成本。為實現(xiàn)前沿級智能,Step 3.5 Flash 還采用了可擴展的強化學習(RL)框架,推動模型在數(shù)學、代碼和?具使用等領域持續(xù)自我提升。
Step 3.5 Flash 在智能體、編碼和數(shù)學任務中展現(xiàn)出卓越性能:在 IMO-AnswerBench 上達到 85.4% 的準確率,在 LiveCodeBench-v6(2024.08?2025.05)上達到 86.4%,在 τ2-Bench 上達到 88.2%,在 BrowseComp(含上下文管理)上達到 69.0%,在 Terminal-Bench 2.0 上達到 51.0%——其性能與 GPT-5.2 xHigh、Gemini 3.0 Pro 等前沿模型相當。通過重新定義效率邊界,Step 3.5 Flash 為在真實工業(yè)環(huán)境中部署復雜智能體提供了高密度基礎。Step3.5Flash 僅1960億總參數(shù)、110億激活參數(shù),就能做到與前沿“巨?!痹谕评砟芰?、智能體能力上性能相當。

上圖:Step 3.5 Flash 僅需 110 億激活參數(shù)(1960 億 MoE 總參數(shù))即可實現(xiàn)前沿級智能,性能比肩主流閉源和開源模型。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關鍵詞:
發(fā)布于
發(fā)布于
快手聯(lián)合歐萊雅打造《最美回家路》,讓團圓不止一種模樣
發(fā)布于
發(fā)布于
六個核桃官宣馬麗×郎朗雙代言,2026年找到了“最對味”的代言人
發(fā)布于
發(fā)布于
發(fā)布于
發(fā)布于