新浪微博開源 VibeThinker-3B,3B 參數模型符合前沿推理效能

根據 Beating intelligence,新浪微博團隊近期開源了 VibeThinker-3B,這是一款具有 30 億參數的推理模型,能在數學與程式碼任務上達到前沿等級的表現,其部分指標接近或超過 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro。

該模型基於 Qwen2.5-Coder-3B,使用頻譜到訊號的訓練管線,並具備 64K 推理空間。透過推理過程中的自我蒸餾以及逐步層級驗證,VibeThinker-3B 將 AIME26 數學測試成績從 94.3 提升至 97.1。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆