马斯克(Elon Musk)於 5 月 15 日在 X 上宣布,最新版 X 演算法已发布至 GitHub。根據 xAI 在 GitHub 上公开的 xai-org/x-algorithm repository,这次釋出的內容主軸,是驅动 X 平台「For You」资訊流的核心推薦系统。該系统結合使用者已追蹤帳號的站內內容,以及由机器学習从全球內容庫中挖掘出的站外內容,最后再交由基於 Grok 架構的 transformer 模型进行排序。
該專案採 Apache 2.0 授權,主要以 Rust 与 Python 寫成;截至查詢时,GitHub 顯示已有约 2.1 万个 stars、3,800 个 forks。
For You 推薦架構:Thunder 找追蹤內容,Phoenix 挖站外內容
根據 repository 说明文件,X 的 For You 资訊流主要由两種候选內容来源組成。
第一是站內內容,由 Thunder 模組负责。Thunder 是一个記憶體內貼文儲存区与即时资料攝取管線,会从 Kafka 消费貼文建立与刪除事件,追蹤所有使用者的近期貼文,並向请求者提供来自其追蹤帳號的內容候选。文件強调,Thunder 可在不查詢外部资料庫的情況下,提供站內內容候选的次毫秒級查詢。
第二是站外內容,由 Phoenix Retrieval 负责。Phoenix 会从全球內容庫中找出使用者可能感興趣、但並非来自追蹤帳號的貼文。其檢索階段採用雙塔模型(Two-Tower Model):User Tower 將使用者特徵与互动歷史編碼成向量,Candidate Tower 將候选貼文編碼成向量,再透过点積相似度找出最相关的內容。
这些候选內容会进入 Home Mixer,也就是 For You 资訊流的協调層。Home Mixer 会负责查詢使用者上下文、取得候选內容、補齐貼文与作者资料、过濾不合格內容、呼叫排序模型、套用分數调整,最后选出要顯示在使用者 For You 頁面的貼文。文件也指出,Home Mixer 对外提供 ScoredPostsService 这个 gRPC 端点,用来为特定使用者回傳已排序貼文。
Grok 架構成为推薦系统核心
这次最受关注的地方,是 X 推薦系统明確導入 Grok 架構。
GitHub README 指出,For You feed 的內容会由 Phoenix 进行排序,而 Phoenix 是一个基於 Grok 的 transformer 模型,会预測每篇貼文可能引发的互动机率,最后再將这些预測值加權組合成最終分數。文件也註明,这份 repository 中的 transformer 实作,是移植自 xAI 开源的 Grok-1,並針对推薦系统使用情境调整,例如加入自訂输入嵌入与候选隔离用的 attention mask。
但这並不等於 X 把完整生产環境模型全部公开。Phoenix README 明確寫道,这次釋出的是 mini version,production 使用的是更大模型,具備更多層數与更寬的 embeddings;同时,公开版 checkpoint 是从连续訓練流程中凍結出来的一个时间点快照,而生产環境 Phoenix 則会持续依照即时资料訓練。
5 月 15 日更新:可執行端到端推論、迷你 Phoenix 模型、廣告混合系统
根據 GitHub 更新说明,5 月 15 日版本新增了多个关鍵元件。
首先是端到端推論流程。新的 phoenix/run_pipeline.py 取代原本分开的 run_ranker.py 与 run_retrieval.py,可用單一入口串接「檢索 → 排序」流程,並以 exported checkpoints 執行,模擬生产環境中两个階段如何組合。
其次是预訓練模型 artifact。这次釋出的 mini Phoenix model 透过 Git LFS 发布,文件稱其包含 256 維 embeddings、4 个 attention heads、2 層 transformer,约 3GB,可让开发者不必自行訓練模型也能进行 out-of-the-box inference。Phoenix README 另指出,公开的 demo corpus 是一个约 53.7 万筆、来自 6 小时視窗的运动主題貼文资料集,用於展示 retrieval 階段。
此外,repository 也新增 Grox content-understanding pipeline,用於 spam detection、post-category classification、PTOS policy enforcement 等內容理解任務;同时新增 Home Mixer 的廣告混合系统,负责资訊流中的廣告插入与位置安排,並納入品牌安全追蹤。
排序模型一次预測 15 種互动,不只是單一「相关性」分數
Phoenix 的排序模型並不是只输出一个抽象的「相关性」分數,而是同时预測多種互动行为的发生机率。
根據文件,模型会预測包括 favorite、reply、repost、quote、click、profile click、video view、photo expand、share、dwell、follow author,以及 not interested、block author、mute author、report 等 15 種行为。
接著 Weighted Scorer 会將这些互动机率加權組合成最終分數,正向行为如按讚、转发、分享給予正權重,负向行为如封锁、靜音、檢舉則給予负權重,把使用者可能不喜歡的內容往下壓。
完成模型分數后,系统还会再套用其他调整。例如 Author Diversity Scorer 会降低重複作者的分數,以維持资訊流多樣性;OON Scorer 則会调整 out-of-network 內容,也就是非追蹤帳號內容的分數。
这代表 X 的「For You」並不是單純把最可能被按讚的貼文往上推,而是把多種互动行为拆开预測,再透过權重设计形成最終排序。这也意味著,演算法真正的价值判斷,並不只存在於模型本身,也存在於各種互动權重与后處理規則中。
候选隔离:貼文分數不应被同批其他貼文影響
这次文件中特別值得注意的是「候选隔离」(Candidate Isolation)。
Phoenix README 指出,在 ranking 階段,候选貼文之间不能互相 attend,只能注意到使用者与其歷史紀錄。这項设计的目的,是確保單篇貼文的分數不会因为它和哪些其他貼文一起被放进 batch 而改變。換句話说,一篇貼文的分數应該取決於它和使用者之间的关係,而不是同批次中剛好有哪些競爭貼文。
这对創作者也有潛在意義。过去不少社群操作会推測,发文时间是否应避开熱门事件或高互动貼文,以免在推薦池中被強勢內容壓过。但若候选隔离如文件所述落实,至少在模型推論層面,單篇貼文的分數不会因同批次出现其他強貼文而直接改變。
不过,这不代表发文时间完全不重要。因为前段候选召回、貼文新鮮度、使用者在線时段、已看过內容过濾、熱门事件競爭注意力等因素,仍可能影響最終曝光。
「无人工特徵」敘事仍有爭议:模型排序之外,人工規則仍存在
xAI 在文件中宣稱,系统已消除所有人工设计特徵与大部分啟发式規則,主要依靠 Grok-based transformer 从使用者互动序列中学習相关性。文件也列出五項核心设计,包括无人工设计特徵、排序階段候选隔离、雜湊式嵌入、多行为预測,以及可組合的 pipeline 架構。
但这个说法需要更精準解读。从同一份文件也能看到,For You feed 在进入排序前会先经过大量 pre-scoring filters,例如移除重複貼文、太舊貼文、使用者自己的貼文、被封锁或靜音帳號、靜音关鍵字、已看过或近期已出现过的內容,以及不符合资格的訂阅內容。排序后还会经过刪除、spam、暴力血腥內容与对話串重複分支等 post-selection filters。
因此,较準確的说法应該是:X 宣稱「內容相关性的候选排序」主要由 Grok-based transformer 学習而来,不再依賴傳统手工內容特徵;但整个 For You 资訊流仍有大量产品規則、过濾器、權重与后處理机制。这些規則同樣会形塑使用者最終看到的內容。
实戰教学:如何利用 X 演算法经營帳號
实戰来看,創作者若想「順著演算法」经營 X 帳號,重点已不只是單純追求按讚或转发,而是要理解 For You 系统会同时評估多種互动訊號。正向訊號包括停留时间、点擊、回覆、转发、追蹤作者、觀看影片与展开圖片;负向訊號則包括不感興趣、靜音、封锁与檢舉。
这代表內容不能只靠聳动標題騙点擊,因为若使用者点进来后快速滑走、按下不感興趣,甚至封锁作者,反而可能拉低后续推薦表现。
对帳號经營者而言,较有效的策略是提高「互动品质」:开头要在前幾秒抓住注意力,內文要能让人停留阅读,結尾則可设计让读者自然回覆或分享的觀点,而不是硬性誘導互动。同时,由於系统有作者多樣性调整,短时间密集连发未必能線性放大曝光,反而可能被同作者降權稀釋;更合理的做法是控制发文節奏,让每篇內容都有明確主題、足夠资訊密度与可被转傳的立场。
最后,站外內容推薦意味著帳號不必只依賴既有粉絲,只要內容能让陌生受眾产生停留、点擊与追蹤行为,就有机会被推进更大的 For You 流量池;但前提是避免低品质農场文、重複內容与过度爭议操作,因为这些行为一旦引发靜音、封锁或檢舉,演算法給的懲罰通常比短期流量紅利更重。
这篇文章 X 公开「For You」推薦演算法原始碼:利用演算法经營推特帳號的实戰教学 最早出现於 链新聞 ABMedia。
相关快讯