🔥 WCTC S8 全球交易賽正式開賽!
8,000,000 USDT 超級獎池解鎖開啟
🏆 團隊賽:上半場正式開啟,預報名階段 5,500+ 戰隊現已集結
交易量收益額雙重比拼,解鎖上半場 1,800,000 USDT 獎池
🏆 個人賽:現貨、合約、TradFi、ETF、閃兌、跟單齊上陣
全場交易量比拼,瓜分 2,000,000 USDT 獎池
🏆 王者 PK 賽:零門檻參與,實時匹配享受戰鬥快感
收益率即時 PK,瓜分 1,600,000 USDT 獎池
活動時間:2026 年 4 月 23 日 16:00:00 - 2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即參與:https://www.gate.com/competition/wctc-s8
#WCTCS8
GLM-5.1讓開源模型第一次在長時間工程任務上站穩腳跟
開源模型開始在長時間任務上較真了
OpenRouter宣布集成GLM-5.1,把話題從"參數有多大"拉到了"能連續幹多久"。GLM-5.1在沒有人盯著的情況下對向量資料庫優化跑了8小時,迭代600多次,性能提升6倍。這改變了開源模型的定位:不再只是便宜的替代品,在工程類工作流程裡可能更能打——特別是Claude Opus 4.6這類閉源模型經常試幾下就不再改進了。Hugging Face高層幫著宣傳,但推文基本沒提算力成本的事。
反應還是老樣子,兩極分化:
幾個值得注意的點:
跑分成績和實際落地之間的差距
"長時間任務完成率"這個說法引起了爭論。Z.ai的演示(比如自己搭Linux桌面)和榜單上GLM-5.1在Terminal-Bench 2.0的63.5%(優化後69%)對不上。行銷和實測之間有差距:宣傳需要熱度,但企業要的是能驗證的案例,比如Bella Protocol的信號機器人集成。VentureBeat和Computerworld用"8小時工作日"這個角度把投資者預期抬高了。參數量在"能持續產出"面前變得沒那麼重要——GLM-5.1在這點上交了卷,但運維成本也更高。
這條傳播路徑——推文到專家轉發再到媒體跟進——逼著閉源實驗室解釋為什麼要收那麼貴。Anthropic可能會推"更快版本"(比如Claude Opus 4.6 Fast)來應對。市場習慣盯著SOTA看,但低估了地緣因素可能造成的市場分裂。GLM-5.1正在測試中國AI出海策略能走多遠。
結論:GLM-5.1把"能連續跑幾個小時"變成了工程任務的核心指標,開源在特定工作流程裡開始成為預設選項。現在花精力做效率優化和混合架構驗證的團隊,下一階段會更有優勢。
重要性:高
分類:模型發布、行業趨勢、開源
判斷:對願意自己搭建和調參的Builder、做基礎設施的基金來說,這是早期紅利窗口。只追通用對話能力的,相關度不高。現在不動手做長時間任務和Serving優化實驗的團隊,下一輪企業落地潮會落後。