OpenAI dan Broadcom Meluncurkan Jalapeño, Chip AI Khusus Pertama untuk Inferensi LLM

OpenAI dan Broadcom hari ini meluncurkan Jalapeño, prosesor Intelijen pertama milik OpenAI yang dirancang untuk inferensi model bahasa besar. Chip tersebut diserahkan kepada CEO OpenAI Sam Altman dan Presiden Greg Brockman oleh Presiden dan CEO Broadcom Hock Tan serta Presiden Charlie Kawwas. Akselerator ini mewakili chip AI pertama dalam platform komputasi multi-generasi yang sedang dibangun oleh kedua perusahaan untuk membuat AI lanjutan lebih cepat, lebih andal, dan lebih mudah diakses. OpenAI merancang chip tersebut dari awal berdasarkan pemahaman mereka tentang fundamental LLM, dengan Broadcom dan Celestica membantu mengindustrialisasi platform melalui implementasi chip, integrasi sistem board dan rack, jaringan berkinerja tinggi, dan sistem produksi yang dapat diskalakan.

OpenAI dan Broadcom Menyerahkan Chip Jalapeño kepada Pimpinan Perusahaan

Pengiriman chip ini menandai langkah penting dalam strategi OpenAI untuk membangun tumpukan penuh di balik model dan produknya. Jalapeño dikembangkan melalui kolaborasi antara OpenAI, Broadcom, dan Celestica, dengan masing-masing mitra menyumbangkan keahlian khusus untuk platform tersebut.

OpenAI merancang arsitektur chip berdasarkan peta jalan model, kernel, sistem penyajian, dan kebutuhan produknya. Broadcom berkontribusi pada implementasi chip dan teknologi jaringan, termasuk silikon Tomahawk, untuk membawa platform ke produksi skala besar. Celestica menyediakan keahlian integrasi sistem board, rack, dan sistem produksi yang dapat diskalakan.

Arsitektur Jalapeño Dioptimalkan untuk Beban Kerja Inferensi LLM

Jalapeño dirancang dengan fleksibilitas untuk bekerja dengan semua LLM yang dipandu oleh wawasan OpenAI tentang kebutuhan inferensi model AI saat ini dan masa depan di seluruh industri. Sampel teknik sudah menjalankan beban kerja ML di laboratorium pada frekuensi dan daya target produksi, termasuk GPT-5.3-Codex-Spark. Pengujian awal menunjukkan bahwa Jalapeño akan memberikan kinerja per watt yang jauh lebih baik dibandingkan state-of-the-art saat ini. Arsitektur ini mengurangi perpindahan data dan menyeimbangkan sumber daya komputasi, memori, dan jaringan untuk mencapai utilisasi nyata yang jauh lebih mendekati kinerja puncak teoretis. Laporan teknis terperinci akan disajikan dalam beberapa bulan mendatang.

"Jalapeño dirancang dari awal untuk inferensi LLM menggunakan wawasan terperinci dari kolaborasi erat kami dengan peneliti OpenAI," kata Richard Ho, yang memimpin program perangkat keras OpenAI. "Kami mengoptimalkan arsitektur di sekitar kernel, pergerakan memori, jaringan, dan pola penyajian yang paling penting untuk model AI mutakhir. Berdasarkan pengujian awal, Jalapeño akan mengeksekusi beban kerja terpenting kami secara efisien mendekati batas teoretis perangkat keras."

Chip ini adalah desain dari awal untuk inferensi LLM modern, bukan akselerator tujuan umum yang diadaptasi dari beban kerja AI sebelumnya. Ini didasarkan pada sistem yang dijalankan OpenAI setiap hari di ChatGPT, Codex, API, dan produk agentik masa depan. Tujuannya adalah menggabungkan daya dan throughput akselerator AI terkemuka saat ini dengan latensi yang mendekati sistem inferensi khusus tercepat.

Pengembangan Diselesaikan dalam Jangka Waktu Sembilan Bulan Menggunakan Desain Berbantuan AI

Jalapeño dikembangkan bersama dari desain awal hingga tape-out manufaktur hanya dalam sembilan bulan. Perusahaan-perusahaan tersebut percaya ini mewakili siklus pengembangan ASIC tercepat yang pernah dicapai dalam semikonduktor canggih berkinerja tinggi. Garis waktu yang dipercepat mencerminkan pengembangan bersama perangkat lunak-perangkat keras yang mendalam dengan tim teknik OpenAI, keahlian implementasi silikon Broadcom, dan penggunaan model OpenAI untuk mempercepat bagian dari proses desain dan optimasi. Model yang sama yang dilayani kepada pengguna membantu meningkatkan infrastruktur yang digunakan untuk menjalankan model masa depan.

Platform Komputasi Multi-Generasi Direncanakan dengan Broadcom dan Celestica

Jalapeño adalah langkah pertama dalam platform komputasi multi-generasi yang menggabungkan akselerator rancangan OpenAI dengan implementasi silikon, jaringan, dan teknologi konektivitas Broadcom, serta keahlian sistem board dan rack Celestica. "Dunia bergerak menuju ekonomi bertenaga komputasi," kata Greg Brockman, Presiden dan Salah Satu Pendiri OpenAI. "Jalapeño adalah bagian dari strategi infrastruktur tumpukan penuh jangka panjang kami untuk membuat komputasi lebih melimpah, menghasilkan AI yang lebih cepat, lebih andal, lebih terjangkau bagi orang dan bisnis, dan dapat digunakan untuk memecahkan masalah yang lebih penting. Dengan mendesain lebih banyak tumpukan sendiri, kami dapat melayani lebih banyak kecerdasan dengan efisiensi yang lebih besar dan terus mendorong AI lanjutan menuju akses yang lebih luas."

Penjadwalan Penerapan pada Akhir 2026

Platform komputasi multi-generasi ini dirancang untuk penerapan awal pada akhir tahun 2026 dan akan diperluas di tahun-tahun mendatang. OpenAI beroperasi di seluruh tumpukan penuh, termasuk arsitektur chip, kernel, sistem memori, jaringan, penjadwalan, sistem penerapan, dan pengalaman produk, dengan setiap lapisan dioptimalkan untuk membuat modelnya lebih cepat, lebih andal, dan lebih terjangkau bagi pengguna.

FAQ

Apa itu Jalapeño dan kapan diluncurkan?

Jalapeño adalah Prosesor Intelijen pertama milik OpenAI, akselerator AI yang dirancang khusus untuk inferensi model bahasa besar. OpenAI dan Broadcom meluncurkan chip tersebut hari ini.

Berapa lama waktu yang dibutuhkan untuk mengembangkan Jalapeño?

Jalapeño dikembangkan bersama dari desain awal hingga tape-out manufaktur dalam sembilan bulan. Perusahaan-perusahaan tersebut percaya ini mewakili siklus pengembangan ASIC tercepat yang pernah dicapai dalam semikonduktor canggih berkinerja tinggi.

Kapan Jalapeño akan diterapkan?

Platform komputasi multi-generasi yang menampilkan Jalapeño dirancang untuk penerapan awal pada akhir tahun 2026, dengan perluasan yang direncanakan di tahun-tahun mendatang.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar