币界网消息,图像生成初创公司Reve发布了4K图像生成模型Reve 2.0,该模型在文本生成图像竞技场中排名第二,仅次于OpenAI的GPT Image 2。Reve 2.0的核心突破在于采用结构化的「布局(layout)」作为中间表示,直接指定图像中物体的类别、位置和尺寸,从而提高生成结果的控制力。布局介质的使用显著降低了计算开销,使团队能够以较少的计算资源与GPU消耗与竞争对手抗衡。Reve 2.0实现了「图像即代码」的概念,用户和AI智能体可以通过修改布局代码或点击特定区域进行无损的像素级编辑,打破了传统文本提示词的局限。

此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 11
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
玻璃穹顶晒月光
· 4小時前
圖像即代碼這個概念太酷了,終於不用跟AI猜謎語了
查看原文回復0
电光石火的冷静
· 8小時前
Reve這波彎道超車,OpenAI估計得加個班
查看原文回復0
极光下的孤石
· 10小時前
layout作為中間層確實聰明,算力不夠技巧湊
查看原文回復0
蓝色多签
· 12小時前
Reve 2.0讓我想起了前端開發,div套div的既視感
查看原文回復0
赛博桥下的风
· 12小時前
GPT Image 2 下面就是 Reve,這榜單越來越有意思
查看原文回復0
玻璃穹顶星尘
· 12小時前
初創公司干翻大廠敘事,Web3人DNA動了
查看原文回復0
Degen Librarian
· 12小時前
無損編輯+程式碼控制,AI繪圖進入可維護時代了屬於是
查看原文回復0
青柠杠杆警报
· 12小時前
點擊區域直接改圖,這才是人機交互該有的樣子
查看原文回復0
YieldNotYell
· 12小時前
文本生成圖像競技場第二?這個排名含金量如何
查看原文回復0
玻璃心做市商
· 12小時前
4K+像素級編輯,設計師狂喜
查看原文回復0
查看更多