Insinyur OpenAI Clive Chan Menantang Rekomendasi Perangkat Keras V4, Mengutip Kesalahan dan Ketidakjelasan Dibanding V3

Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya “mencengangkan: biasa saja dan rawan kesalahan” dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab yang menjadi topik diskusi paling populer di konferensi akademik ISCA, menawarkan rekomendasi spesifik yang selaras dengan standar interkoneksi industri. V4, sebaliknya, jauh lebih kabur.

Chan secara sistematis menantang tiga rekomendasi utama. Terkait konsumsi daya, laporan tersebut menyarankan bahwa optimasi perangkat lunak memungkinkan chip menjalankan komputasi, penyimpanan, dan komunikasi pada kapasitas penuh secara bersamaan, serta merekomendasikan agar produsen chip menyisakan margin daya tambahan. Chan berpendapat ini kontraproduktif: total daya chip dibatasi oleh keterbatasan proses fisik, sehingga menyisakan lebih banyak margin daya hanya menurunkan frekuensi operasi, yang pada akhirnya mengurangi kinerja komputasi. Mengenai transfer data GPU-ke-GPU, laporan tersebut menganjurkan model pull—di mana GPU secara aktif mengambil data—dibandingkan model push, dengan alasan tingginya overhead notifikasi pada operasi push. Chan membantah hal itu, dengan mengatakan bahwa pull sebenarnya lebih lambat dan bahwa kemampuan adaptor jaringan yang ditingkatkan akan lebih disukai. Namun, keduanya mungkin membahas lapisan yang berbeda dari masalah ini: laporan membahas overhead mekanisme notifikasi, sedangkan Chan merujuk pada latensi transmisi itu sendiri.

Untuk fungsi aktivasi, laporan tersebut merekomendasikan mengganti SwiGLU dengan fungsi yang lebih sederhana untuk mengurangi beban komputasi. Chan tidak melihat manfaat apa pun dari hal tersebut, dengan mencatat bahwa Sonic MoE sudah menunjukkan kinerja optimal menggunakan SwiGLU. Chan menduga DeepSeek mungkin “secara sengaja melemahkan bagian ini.”

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

AISI menilai: kemampuan serangan siber GPT-5.5 setara dengan Anthropic Mythos

AISI pada Mei mengumumkan penilaian kemampuan serangan berbasis internet GPT-5.5: tingkat kesulitan Expert 71,4%, Mythos Preview 68,6%, dengan selisih masih dalam batas galat, setara. GPT-5.5 menjadi sistem kedua yang dapat secara otomatis menyelesaikan invasi perusahaan “The Last Ones” dalam 32 langkah, setelah Mythos. Turut ditemukan universal jailbreak yang dapat dikembangkan dalam sekitar 6 jam, mampu menghindari penyaringan kueri berbahaya. Ke depan akan memantau jadwal penilaian putaran berikutnya dan pembaruan OpenAI terkait hal ini.

ChainNewsAbmedia32menit yang lalu

Pentagon menandatangani kontrak penempatan jaringan militer rahasia dengan 7 perusahaan raksasa AI: Anthropic tetap dikecualikan

Kementerian Pertahanan AS pada bulan Mei mengumumkan telah menandatangani kontrak penempatan jaringan militer rahasia dengan SpaceX, OpenAI, Google, NVIDIA, Reflection, Microsoft, Amazon Web Services, dan lainnya sebanyak 7 perusahaan, dengan tambahan Oracle sehingga menjadi perusahaan ke-8. Kontrak memungkinkan model berjalan pada level kerahasiaan tertinggi Impact Level 6/7, dengan fokus pada tiga aplikasi utama: integrasi data, pengambilan keputusan tempur, dan kesadaran situasi di medan perang, serta menekankan pada penyebaran risiko dan menghindari pengikatan pemasok. Anthropic dimasukkan ke dalam daftar hitam karena menolak pagar pengaman keamanan untuk pihak militer dan tidak ditandatangani kontraknya. AMD tidak secara langsung dimasukkan; GPU disediakan oleh NVIDIA dan lainnya. Ke depannya, pemantauan apakah Anthropic akan melunak, serta peran pendatang baru seperti Reflection.

ChainNewsAbmedia34menit yang lalu

Cerebras Menargetkan $4B IPO, Dinilai Sekitar ~$40B

Perusahaan pembuat chip AI Cerebras Systems berbasis di Sunnyvale, California sedang mengincar IPO hingga US$4 miliar yang berpotensi menilai perusahaan itu pada kisaran US$40 miliar, menurut Bloomberg. Pemasaran resmi bisa dimulai paling cepat 4 Mei, dengan bank menerima lebih dari US$10 miliar dalam indikasi dari

CryptoFrontier37menit yang lalu

Perusahaan AI Tiongkok Mempertimbangkan Membongkar Struktur Red-Chip Setelah Penghentian Akuisisi Manus oleh Meta

Menurut Beating, Komisi Nasional Pembangunan dan Reformasi China menghentikan akuisisi Meta senilai 2 miliar dolar AS atas perusahaan agen AI Manus, sehingga Komisi Pengawas Sekuritas China memperketat persetujuan untuk pencatatan IPO Hong Kong oleh perusahaan red-chip (perusahaan asal China yang memegang aset domestik th

GateNews2jam yang lalu

Musk Menyelesaikan Kesaksian Uji Coba Tiga Hari dalam Gugatan OpenAI, Mengutip Klaim Kerugian Senilai $130-150B

Menurut beberapa laporan media, Elon Musk menyelesaikan kesaksian selama tiga hari dalam gugatanya melawan OpenAI pada 28-30 April, dengan total waktu kesaksian lebih dari 7 jam. Musk, yang mendirikan OpenAI pada 2015 bersama investasi awal sebesar $38 juta, mengklaim perusahaan tersebut meninggalkan m

GateNews2jam yang lalu

Meta Mengakuisisi Startup AI Robotika Assured Robot Intelligence pada 1 Mei

Menurut Bloomberg, Meta mengakuisisi Assured Robot Intelligence, startup robotika AI dengan kantor di San Diego dan New York, pada 1 Mei. Tim yang diakuisisi, termasuk para pendiri Lerrel Pinto dan Xiaolong Wang, akan bergabung dengan Meta Superintelligence Labs dan bekerja dengan Meta Robotics Studio. Keuangan

GateNews2jam yang lalu
Komentar
0/400
Tidak ada komentar