Gate News 消息,4 月 24 日 — V4 已公開披露其 V4-Pro 模型的內部自我測試(dogfooding)數據。該公司從超過 50 位工程師收集了約 200 項真實世界的工程任務,涵蓋功能開發、錯誤修復、重構以及跨技術棧的診斷,包括 PyTorch、CUDA、Rust 和 C++。經過嚴格篩選後,保留了 30 項任務用於基準評估。
V4-Pro-Max 的程式通過率達到 67%,顯著超越 Sonnet 4.5 的 47%,並接近 Opus 4.5 的 70%。不過,它仍落後於 Opus 4.5 Thinking (73%) 與 Opus 4.6 Thinking (80%),同時遠高於 Haiku 4.5 的 13%。
在一項包含 85 位受訪者的內部調查中,所有參與者都表示在日常工作流程中使用 V4-Pro 進行具代理(agentic)的程式編寫。52% 將 V4-Pro 作為其預設的主要程式模型,39% 傾向於表示批准,而不到 9% 表達不認同。回報的問題包括底層錯誤、對含糊指令的誤解,以及偶爾出現過度思考的行為。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
科羅拉多州立法者提出以 AI 法替代方案,以回應產業關切
科羅拉多州立法者正推動廢止並取代該州 2024 年的人工智慧法,SB24-205,並以新規則取而代之。新規則將縮小 AI 監管範圍,同時回應產業對遵循負擔的擔憂。新的提案,SB26-189,將規範用於
Crypto Frontier4小時前
R0AR 進入 Consensus 2026 PitchFest 決賽,僅差進入前 20 名
根據 MetaversePost,R0AR 於 5 月 4 日晉級 CoinDesk「Consensus 2026 PitchFest」的最後遴選輪次,僅差一點就進入入選進行現場簡報的前 20 家新創公司。這位 Web3 和 AI 領域的創新者與全球其他高潛力新創公司一同被評估於產業的其中一個主要活動場景中。
GateNews8小時前
馬斯克在開庭前向 OpenAI 尋求 1500 億美元和解金,和解談判破裂
根據一份法院文件,Elon Musk 在 4 月 26 日聯繫了 OpenAI 總裁 Greg Brockman,時間是在他們的審判於奧克蘭聯邦法院開庭的兩天前,目的是探討和解。當 Brockman 建議雙方都撤回他們的主張時,Musk 回覆了威脅,對 Brockman 說:「到結束時
GateNews8小時前
Cursor 接受 SpaceX 的 600 億美元收購要約,但不願在代碼模型上與 xAI 合作
根據 The Information,Cursor 已接受來自 SpaceX 的一項有條件 600 億美元收購要約,儘管該交易尚未完成。該公司目前沒有計劃與 SpaceX 的 AI 部門 xAI 合作開發程式碼模型。相反地,Cursor 正在專注於對其進行優化
GateNews8小時前
Haun Ventures 於 5 月 4 日關閉 10 億美元基金,並在早期與晚期加密投資之間分配資本
根據彭博社,Haun Ventures 於 5 月 4 日完成了一輪 10 億美元的募資,當中 5 億美元用於早期投資,另 5 億美元用於後期投資。該基金將在未來兩到三年內部署資金,目標是加密貨幣與區塊鏈新創,同時擴展
GateNews9小時前
OpenAI 為部署合資企業籌集 $4 十億美元,估值 100 億美元
根據 BlockBeats,5 月 4 日,OpenAI 融資規模超過 $4 billion,以成立一家新的合資企業,專注於協助企業採用其人工智慧軟體。該合資企業名為 The Deployment Company,獲 19 位投資者支持,其中包括 TPG Inc.、Brookfield Asset Management、
GateNews10小時前