Google Meluncurkan Chip AI Terpisah untuk Pelatihan dan Inferensi, Meningkatkan Kinerja 2,8x

Pesan Berita Gate, 23 April — Google mengumumkan pada 22 April bahwa pihaknya akan merilis chip TPU generasi kedelapan yang terpisah untuk pelatihan dan inferensi pada akhir tahun ini, menggantikan desain gabungannya sebelumnya. Langkah ini menargetkan beban kerja AI agent dan memberi pelanggan Google Cloud alternatif selain perangkat keras Nvidia.

Chip pelatihan memberikan kinerja 2,8 kali lebih tinggi dibanding TPU Ironwood generasi ketujuh milik Google dengan harga yang sama, sementara chip inferensi 80% lebih cepat dan dilengkapi SRAM 384 MB, tiga kali lipat jumlah yang ada di Ironwood. Pemisahan kapabilitas pelatihan dan inferensi mencerminkan pergeseran cara perusahaan mengoptimalkan untuk kebutuhan komputasi yang berbeda.

Inisiatif ini didukung oleh kemitraan jangka panjang dengan Broadcom dan Anthropic. Anthropic berencana menggunakan sekitar 3,5 gigawatt komputasi TPU melalui Broadcom mulai tahun 2027, dengan Broadcom menangani manufaktur chip dan komponen jaringan hingga 2031. Anthropic, perusahaan rintisan AI di balik Claude, baru-baru ini melihat pendapatan tahunan yang dinormalisasi melebihi $30 billion. Sementara itu, Apple, Microsoft, Meta, dan Amazon juga memperluas upaya chip AI khusus untuk mengurangi ketergantungan pada Nvidia, yang tetap menjadi pemimpin pasar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Pengguna ChatGPT Kini Bisa Mengakses Langganan di Platform OpenClaw, Sam Altman Mengumumkan

Menurut pengumuman Sam Altman hari ini, pengguna ChatGPT kini dapat masuk ke platform agen OpenClaw menggunakan akun ChatGPT mereka dan langsung mengakses langganan ChatGPT yang sudah ada di platform tersebut.

GateNews1menit yang lalu

xAI Meluncurkan Grok Custom Voices, Memungkinkan Pengguna Mengkloning Suara AI Mereka Sendiri dalam Satu Menit

Menurut Beating, xAI meluncurkan Grok Custom Voices dan Voice Library, yang memungkinkan pengguna merekam satu menit audio di konsol xAI untuk membuat custom voice_id yang dapat digunakan dengan API Grok TTS dan Voice Agent. Fitur ini mendukung aplikasi termasuk agen layanan pelanggan, pembuatan konten,

GateNews58menit yang lalu

Setelah HBM, apakah bottleneck memori AI adalah HBF? Pemenang Penghargaan Turing David Patterson: Inferensi akan mendefinisikan ulang arsitektur penyimpanan

Pemenang Penghargaan Turing David Patterson menyoroti bahwa seiring AI beralih dari pelatihan ke inferensi skala besar, hambatan memori berikutnya mungkin bukan HBM, melainkan HBF (high-bandwidth flash memory). HBF menyediakan kapasitas besar dan konsumsi daya rendah dengan tumpukan NAND Flash, berperan untuk akses konteks dan data antara dalam proses inferensi, berbeda dengan HBM yang berfokus pada kecepatan. SK hynix dan SanDisk mendorong standarisasi, dan memperkirakan kebutuhan HBF pada tahun 2038 bisa melampaui HBM.

ChainNewsAbmedia1jam yang lalu

Konferensi Pengembang Anthropic Code With Claude dibuka di San Francisco pada 6/5: streaming langsung gratis, daftar

Anthropic pada 1 Mei mengumumkan konferensi pengembang perdana “Code with Claude” akan dibuka pada 6 Mei di San Francisco, dan untuk pertama kalinya diperluas dengan tur ke London (19/5) serta Tokyo (10/6) untuk mengunjungi tiga kota. Kuota kursi untuk pertemuan utama di lokasi di masing-masing dari tiga kota menggunakan sistem undian, semuanya sudah terpilih, namun pendaftaran untuk siaran langsung tetap terbuka untuk semua orang. Untuk menjawab lonjakan kebutuhan di lokasi, acara di San Francisco juga menambahkan sesi “Extended” pada 7/5, yang dirancang khusus untuk pengembang independen dan pendiri pada tahap awal. Tur tiga kota: 6/5 San Francisco, 19/5 London, 10/6 Tokyo Code with Claude adalah konferensi pengembang yang diselenggarakan oleh Anthropic; acara utama San Francisco sudah merupakan penyelenggaraan kedua kalinya. Isi 3 acara tersebut sama: lokakarya di tempat sepanjang hari, demo fitur terbaru, serta tiap sesi dengan Claude dalam berbagai bidang

ChainNewsAbmedia1jam yang lalu

OpenAI merilis data satu minggu setelah peluncuran GPT-5.5: pertumbuhan pendapatan API mencapai rekor baru, Codex naik dua kali lipat

OpenAI pada 1 Mei mengumumkan lewat akun resminya 3 data setelah satu minggu peluncuran GPT-5.5: penilaian diri sebagai “penerbitan terkuat sepanjang masa”, kecepatan pertumbuhan pendapatan API lebih dari 2 kali dibanding setiap peluncuran model sebelumnya, dan Codex menggandakan pendapatan dalam waktu kurang dari 7 hari. OpenAI mengaitkan penyebabnya dengan permintaan yang terus meningkat dari sisi perusahaan terhadap alat agentic coding (coding berbasis agen), serta agenda respons bersamaan dengan GPT-5.5-Cyber pada 30 April yang menempuh ritme produk yang sama dengan Anthropic Mythos. 3 data setelah pengumuman: laju penggandaan pendapatan API, Codex naik dua kali dalam 7 hari, penerbitan terkuat 3 angka kunci yang diumumkan OpenAI kali ini berasal dari cuitan resmi, tanpa lampiran laporan keuangan rinci: pertama, GPT-5.5 adalah “yang pertumbuhan pendapatannya terkuat sepanjang masa” dari seg

ChainNewsAbmedia1jam yang lalu

Komite Urusan Luar Negeri DPR AS Bertemu Raksasa Teknologi untuk Kontrol Ekspor AI Setelah Undang-Undang MATCH Disahkan 36-8

Menurut Beating, anggota Komite Urusan Luar Negeri Dewan Perwakilan Rakyat AS akan bepergian ke Silicon Valley minggu depan untuk bertemu dengan perwakilan dari Google, Anthropic, Meta, Tesla, Intel, Applied Materials, dan Nvidia guna membahas kecerdasan buatan dan kontrol ekspor. Sebuah forum diskusi industri adalah s

GateNews2jam yang lalu
Komentar
0/400
Tidak ada komentar