Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Promosi
AI
Gate AI
Partner AI serbaguna untuk Anda
Gate AI Bot
Gunakan Gate AI langsung di aplikasi sosial Anda
GateClaw
Gate Blue Lobster, langsung pakai
Gate for AI Agent
Infrastruktur AI, Gate MCP, Skills, dan CLI
Gate Skills Hub
10RB+ Skills
Dari kantor hingga trading, satu platform keterampilan membuat AI jadi lebih mudah digunakan
GateRouter
Pilih secara cerdas dari 40+ model AI, dengan 0% biaya tambahan
Kecepatan tertinggi 3 kali lipat dan tanpa kerugian, model decoding spekulatif MTP dari seluruh rangkaian Gemma4 open source Google
Menurut pemantauan Beating, Google merilis dan membuka sumber model draft prediksi multi-token (MTP) dari seri Gemma 4.
Ini adalah model bantu ringan yang menggunakan arsitektur decoding spekulatif, mampu mempercepat inferensi hingga 3 kali lipat dengan tetap mempertahankan bobot verifikasi akhir dari model utama, tanpa mengurangi kualitas output dan kemampuan penalaran logis.
Model bahasa besar standar hanya dapat menghasilkan satu token setiap kali, mudah dibatasi oleh bandwidth memori GPU dan menyebabkan inefisiensi komputasi.
Solusi MTP memungkinkan model draft ringan memanfaatkan kapasitas komputasi yang tidak terpakai, memprediksi beberapa token masa depan secara sekaligus sebelumnya, kemudian diverifikasi secara paralel oleh model target berat seperti 31B.
Jika model target menyetujui draft tersebut, maka seluruh rangkaian akan diterima sekaligus.
Untuk meningkatkan efisiensi, model draft langsung berbagi status aktivasi dan cache KV dari model target (menyimpan konteks historis untuk menghindari perhitungan berulang);
untuk model E2B dan E4B di sisi perangkat, tim juga memperkenalkan teknik klasterisasi di lapisan embedding.
Saat ini, model MTP telah dirilis secara lengkap dengan lisensi Apache 2.0 yang sama dengan Gemma 4, dan secara native mendukung kerangka inferensi utama seperti vLLM, SGLang, dan Ollama.
Optimasi peningkatan kecepatan ini secara signifikan menurunkan hambatan penggunaan, memungkinkan pengembang menjalankan model 26B MoE dan 31B dense secara lancar pada GPU konsumen biasa, serta mendukung interaksi AI waktu nyata dengan konsumsi daya yang lebih rendah di perangkat mobile.