Elon Musk pada 15 Mei mengumumkan di X bahwa versi terbaru algoritma X telah dirilis ke GitHub. Berdasarkan repository xAI xai-org/x-algorithm yang dipublikasikan di GitHub, fokus utama rilis kali ini adalah sistem rekomendasi inti yang mendorong aliran informasi «For You» di platform X. Sistem ini menggabungkan konten di dalam platform yang berasal dari akun yang diikuti pengguna, serta konten di luar platform yang digali dari basis konten global oleh machine learning, lalu akhirnya disortir menggunakan model transformer berbasis Grok.
Proyek ini menggunakan lisensi Apache 2.0, terutama ditulis dengan Rust dan Python; hingga saat penelusuran, GitHub menampilkan sekitar 21 ribu stars dan 3.800 forks.
Arsitektur rekomendasi For You: Thunder mencari konten yang diikuti, Phoenix menggali konten di luar
Menurut dokumen penjelasan repository, aliran informasi For You X terutama terdiri dari dua jenis sumber kandidat konten.
Pertama adalah konten di dalam platform, ditangani oleh modul Thunder. Thunder adalah area penyimpanan postingan dalam memori dan pipeline penyerapan data real-time. Thunder mengonsumsi event pembuatan dan penghapusan postingan dari Kafka, melacak postingan terbaru semua pengguna, dan menyediakan kandidat konten dari akun yang diikuti kepada pihak yang melakukan permintaan. Dokumen menekankan bahwa Thunder dapat melakukan kueri tingkat milidetik untuk kandidat konten di dalam platform tanpa perlu mengakses basis data eksternal.
Kedua adalah konten di luar platform, ditangani oleh Phoenix Retrieval. Phoenix akan menemukan postingan yang mungkin menarik bagi pengguna dari basis konten global, namun tidak berasal dari akun yang diikuti. Tahap retrievalnya menggunakan model dua menara (Two-Tower Model): User Tower mengodekan fitur pengguna dan riwayat interaksi menjadi vektor, Candidate Tower mengodekan postingan kandidat menjadi vektor, kemudian mencari konten paling relevan melalui similarity berdasarkan dot product.
Kandidat konten ini kemudian masuk ke Home Mixer, yakni lapisan koordinasi untuk aliran informasi For You. Home Mixer bertanggung jawab untuk menanyakan konteks pengguna, mengambil kandidat konten, melengkapi data postingan dan penulis, menyaring konten yang tidak memenuhi syarat, memanggil model penilaian, menerapkan penyesuaian skor, dan pada akhirnya memilih postingan yang akan ditampilkan di halaman For You pengguna. Dokumen juga menyebutkan bahwa Home Mixer menyediakan endpoint gRPC bernama ScoredPostsService untuk mengembalikan postingan yang sudah diurutkan bagi pengguna tertentu.
Arsitektur Grok menjadi inti sistem rekomendasi
Bagian yang paling mendapat perhatian kali ini adalah X secara tegas memperkenalkan Grok ke dalam sistem rekomendasinya.
README GitHub menyatakan bahwa konten pada feed For You akan disortir oleh Phoenix, dan Phoenix adalah model transformer berbasis Grok yang memprediksi probabilitas interaksi yang mungkin dipicu oleh setiap postingan, lalu menggabungkan nilai prediksi tersebut dengan pembobotan menjadi skor akhir. Dokumen juga mencatat bahwa implementasi transformer di repository ini adalah hasil porting dari Grok-1 sumber terbuka dari xAI, dan disesuaikan untuk skenario penggunaan pada sistem rekomendasi, misalnya dengan menambahkan custom input embeddings serta attention mask untuk isolasi kandidat.
Namun ini tidak berarti X mempublikasikan seluruh model produksi secara lengkap. Phoenix README secara jelas menyatakan bahwa rilis yang dibagikan kali ini adalah versi mini; untuk produksi digunakan model yang lebih besar, dengan lebih banyak layer dan embeddings yang lebih lebar. Selain itu, checkpoint publik dibekukan sebagai snapshot pada satu titik waktu yang diambil dari proses pelatihan berkelanjutan, sementara Phoenix di lingkungan produksi akan terus dilatih berdasarkan data real-time.
Update 15 Mei: inferensi end-to-end yang bisa dijalankan, model mini Phoenix, dan sistem pencampuran iklan
Menurut catatan pembaruan GitHub, versi 15 Mei menambahkan beberapa komponen kunci.
Pertama adalah alur inferensi end-to-end. phoenix/run_pipeline.py yang baru menggantikan run_ranker.py dan run_retrieval.py yang sebelumnya dipisah. Dengan satu pintu masuk, proses «retrieval → ranking» dapat dirangkai, dan dijalankan menggunakan exported checkpoints untuk mensimulasikan bagaimana dua tahap dalam lingkungan produksi digabungkan.
Kedua adalah artifact model terlatih awal. Mini Phoenix model yang dirilis kali ini dibagikan melalui Git LFS; dokumen menyebutkan bahwa model ini mencakup 256 dimensi embeddings, 4 attention heads, 2 layer transformer, dengan ukuran sekitar 3GB. Ini memungkinkan developer melakukan out-of-the-box inference tanpa harus melatih model sendiri. Phoenix README juga menyebutkan bahwa demo corpus yang dipublikasikan adalah dataset postingan bertema olahraga dari jendela waktu sekitar 6 jam, berjumlah kira-kira 537 ribu entri, yang digunakan untuk menampilkan tahap retrieval.
Selain itu, repository juga menambahkan Grox content-understanding pipeline untuk tugas pemahaman konten seperti spam detection, post-category classification, dan PTOS policy enforcement; sekaligus menambahkan sistem pencampuran iklan Home Mixer yang bertugas menyisipkan iklan dalam aliran informasi dan pengaturan posisinya, serta memasukkan pelacakan brand safety.
Model ranking memprediksi 15 jenis interaksi sekaligus, bukan hanya satu skor «relevansi» tunggal
Model ranking Phoenix bukan hanya mengeluarkan satu skor abstrak «relevansi», tetapi memprediksi probabilitas terjadinya banyak perilaku interaksi sekaligus.
Menurut dokumen, model akan memprediksi termasuk favorite, reply, repost, quote, click, profile click, video view, photo expand, share, dwell, follow author, serta not interested, block author, mute author, report—total 15 jenis perilaku.
Selanjutnya Weighted Scorer akan menggabungkan probabilitas interaksi tersebut yang sudah diberi bobot menjadi skor akhir. Perilaku positif seperti like, repost, dan share diberi bobot positif; perilaku negatif seperti block, mute, dan report diberi bobot negatif, sehingga konten yang kemungkinan tidak disukai pengguna akan ditekan ke bawah.
Setelah skor model selesai, sistem masih menerapkan penyesuaian lain. Misalnya Author Diversity Scorer menurunkan skor penulis yang berulang untuk menjaga keberagaman aliran informasi; OON Scorer akan menyesuaikan skor untuk konten out-of-network, yaitu konten yang bukan berasal dari akun yang diikuti.
Ini menunjukkan bahwa «For You» X tidak sekadar mendorong postingan yang paling mungkin mendapat like. Sebaliknya, berbagai perilaku interaksi dipecah menjadi prediksi, lalu dibentuk menjadi ranking akhir melalui desain bobot. Ini juga berarti penilaian nilai algoritmik yang sebenarnya tidak hanya ada pada model itu sendiri, tetapi juga pada berbagai bobot interaksi dan aturan pasca-pemrosesan.
Isolasi kandidat: skor postingan tidak boleh dipengaruhi oleh postingan lain dalam batch yang sama
Bagian yang patut diperhatikan secara khusus dalam dokumen ini adalah «Candidate Isolation» (isolasi kandidat).
Phoenix README menyebutkan bahwa pada tahap ranking, kandidat postingan tidak boleh saling attend satu sama lain; kandidat hanya boleh memperhatikan pengguna dan rekam jejak historisnya. Desain ini bertujuan memastikan skor satu postingan tidak berubah hanya karena postingan itu dimasukkan bersama postingan lain ke dalam batch. Dengan kata lain, skor sebuah postingan harus bergantung pada hubungannya dengan pengguna, bukan pada postingan pesaing mana yang kebetulan muncul dalam batch yang sama.
Hal ini juga memiliki makna potensial bagi kreator. Di masa lalu, banyak praktik di komunitas berspekulasi apakah waktu memposting perlu dihindari dari event populer atau postingan dengan interaksi tinggi agar tidak kalah dalam kolam rekomendasi oleh konten yang lebih kuat. Namun jika isolasi kandidat seperti yang dijelaskan dalam dokumen benar-benar diterapkan, setidaknya pada lapisan inferensi model, skor satu postingan tidak akan berubah secara langsung karena kemunculan postingan kuat lain dalam batch yang sama.
Namun, ini tidak berarti waktu memposting sepenuhnya tidak penting. Karena faktor di tahap awal recall kandidat, kesegaran postingan, waktu saat pengguna online, penyaringan konten yang sudah dilihat, perhatian terhadap kompetisi event populer, dan lain-lain, tetap dapat memengaruhi eksposur akhir.
Narasi «tanpa fitur buatan» masih diperdebatkan: selain ranking model, aturan buatan tetap ada
xAI mengklaim dalam dokumen bahwa sistem telah menghapus semua fitur yang didesain manusia dan sebagian besar aturan heuristik, dengan mengandalkan Grok-based transformer untuk mempelajari relevansi dari urutan interaksi pengguna. Dokumen juga mencantumkan lima desain inti, termasuk tanpa fitur buatan, kandidat isolation pada tahap ranking, hashing embeddings, multi-behavior prediction, serta arsitektur pipeline yang dapat dirangkai.
Namun, klaim ini perlu ditafsirkan lebih presisi. Dari dokumen yang sama juga bisa dilihat bahwa sebelum masuk ke ranking, feed For You lebih dulu melewati banyak pre-scoring filters, seperti menghapus postingan duplikat, postingan yang terlalu lama, postingan milik pengguna sendiri, postingan dari akun yang diblokir atau dimute, kata kunci dimute, konten yang sudah dilihat atau baru-baru ini sudah muncul, serta konten langganan yang tidak memenuhi syarat. Setelah ranking, masih ada post-selection filters seperti penghapusan, spam, konten kekerasan dan darah, serta penghapusan cabang percakapan yang berulang.
Jadi, penjelasan yang lebih akurat adalah: X mengklaim «candidate ranking» untuk relevansi konten terutama dipelajari oleh Grok-based transformer, dan tidak lagi bergantung pada fitur konten manual tradisional; tetapi seluruh aliran informasi For You masih memiliki banyak aturan produk, filter, mekanisme pembobotan, dan pemrosesan pasca. Aturan-aturan inilah yang juga membentuk konten akhir yang dilihat pengguna.
Praktik lapangan: cara memanfaatkan algoritma X untuk mengelola akun
Dalam praktiknya, bagi kreator yang ingin «mengikuti algoritma» untuk mengelola akun X, fokusnya bukan lagi sekadar mengejar like atau repost. Yang lebih penting adalah memahami bahwa sistem For You menilai banyak sinyal interaksi sekaligus. Sinyal positif meliputi waktu tinggal, klik, balasan, repost, mengikuti penulis, menonton video, serta membuka gambar; sinyal negatif meliputi tidak tertarik, mute, block, dan report.
Artinya, konten tidak bisa hanya mengandalkan judul yang sensasional untuk memancing klik. Jika pengguna masuk lalu cepat menggulir, menekan not interested, bahkan memblokir penulis, maka performa rekomendasi berikutnya bisa turun.
Bagi pengelola akun, strategi yang lebih efektif adalah meningkatkan «kualitas interaksi»: buka dengan menangkap perhatian dalam beberapa detik pertama, isi konten harus membuat orang betah membaca, dan penutup dapat dirancang agar pembaca secara alami membalas atau membagikan, bukan memaksa interaksi. Selain itu, karena sistem melakukan penyesuaian keberagaman penulis, rangkaian posting yang padat dalam waktu singkat belum tentu secara linear memperbesar eksposur; malah bisa terdilusi karena penulis yang sama bisa diturunkan. Cara yang lebih masuk akal adalah mengatur ritme posting sehingga setiap konten punya topik yang jelas, kepadatan informasi yang cukup, dan posisi yang bisa diteruskan.
Terakhir, rekomendasi konten di luar platform berarti akun tidak harus hanya mengandalkan basis penggemar yang sudah ada. Selama konten mampu membuat audiens yang belum dikenal bertahan, mengeklik, dan melakukan tindakan mengikuti, ada peluang didorong ke kolam arus For You yang lebih besar. Namun syaratnya adalah menghindari konten petani berkualitas rendah, konten berulang, dan operasi yang terlalu penuh kontroversi. Jika perilaku-perilaku ini memicu mute, block, atau report, hukuman yang diberikan algoritma biasanya lebih berat dibanding bonus lonjakan arus jangka pendek.
Artikel ini mempublikasikan kode sumber rekomendasi «For You» milik X: tutorial praktik memanfaatkan algoritma untuk mengelola akun Twitter. Pertama kali muncul di Liannews ABMedia.
Related News
SpaceX berpeluang mencatatkan diri pada 12/6, berlomba untuk masuk ke indeks Nasdaq 100
Codex masuk ke aplikasi seluler ChatGPT, bisa mengendalikan tugas pengembangan di Mac dari jarak jauh
Pi Network PiScan kembali, peningkatan KYC AI mempersingkat antrean manual 50%
Sam Altman mengumumkan: OpenAI Codex memberikan perusahaan akses “gratis” selama dua bulan
Google berencana bekerja sama dengan SpaceX, program “Pencari Matahari” merancang komputasi AI luar angkasa