GLM-5.1 Menempati puncak LMAArena di leaderboard kode: peringkat 1 sumber terbuka, peringkat 3 global

Berita Pintu Gerbang, 10 April, hari ini, platform evaluasi AI tepercaya global LMArena (platform penilaian model AI dengan pengujian buta yang diikuti oleh jutaan pengguna) memperbarui papan peringkat khusus Code Arena; GLM-5.1 menduduki peringkat pertama untuk model open source global, dan berada di peringkat ketiga untuk model global.

GLM-5.1 tidak hanya mewarisi kemampuan pengkodean open source SOTA dari generasi model sebelumnya, tetapi juga mencapai terobosan pada tugas jarak jauh (Long-Horizon Task), dengan mewujudkan: membangun desktop Linux dari nol dalam 8 jam; 655 iterasi mematahkan hambatan optimasi bottleneck pada basis data vektor; serta 1000 putaran optimasi pemanggilan alat untuk memuat beban model pembelajaran mesin dunia nyata.

Perlu disorot bahwa pada standar evaluasi yang setara di papan peringkat METR, GLM-5.1 adalah satu-satunya model open source yang mencapai kerja berkelanjutan level 8 jam, serta merupakan salah satu dari sedikit model di seluruh dunia selain Claude Opus 4.6 yang memiliki kemampuan tersebut.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Riset Microsoft: Hanya 13% karyawan yang gagal dalam inovasi tempat kerja berbasis AI menerima insentif perusahaan

Berdasarkan laporan Indeks Tren Pekerjaan tahunan yang dirilis Microsoft pada 5 Mei, laporan tersebut menganalisis miliaran sinyal produktivitas Microsoft 365 yang anonim, serta melakukan survei terhadap 20.000 karyawan di beberapa pasar seperti Amerika Serikat, Inggris, India, dan Jepang. Data laporan menunjukkan hanya 13% karyawan yang mengatakan bahwa pemberi kerja akan memberikan insentif ketika mereka mencoba meningkatkan pekerjaan dengan AI tetapi tidak mendapatkan hasil yang diharapkan.

MarketWhisper4menit yang lalu

Meta mengembangkan asisten AI Hatch untuk menyaingi OpenClaw, menyelesaikan uji internal sebelum akhir Juni

Menurut Financial Times pada 5 Mei, Meta sedang mengembangkan asisten AI untuk konsumen umum (Hatch), terinspirasi dari OpenClaw milik OpenAI, dengan target menyelesaikan uji internal sebelum akhir Juni; Meta juga berencana sebelum kuartal keempat tahun ini mengintegrasikan alat belanja berbasis agen yang berdiri sendiri ke layanan Instagram miliknya.

MarketWhisper13menit yang lalu

Sidang Pengadilan OpenAI, Brockman bersaksi: Musk pernah mengatakan tidak akan mengutamakan keamanan; sahamnya berisiko bergerak kasar

Menurut New York Post pada 6 Mei, CEO OpenAI Greg Brockman pada 5 Mei bersaksi di Pengadilan Distrik Federal Oakland di California, mengungkapkan pidato untuk semua pihak yang disampaikan Musk saat keluar dari dewan OpenAI pada 2018. Brockman mengatakan bahwa saat mendorong AI di Tesla, Musk “tidak akan menghabiskan waktu untuk keamanan”, serta bahwa pada 2017 ia sempat terlibat pembicaraan yang nyaris berujung kekerasan dengan salah satu pendiri OpenAI terkait porsi kepemilikan saham.

MarketWhisper1jam yang lalu

Perusahaan Keamanan Siber India Memakai AI untuk Memangkas Pengujian Kerentanan hingga Hitungan Jam

Perusahaan keamanan siber India termasuk Indusface dan Astra Security sedang mengadopsi agen AI yang dibangun di atas model bahasa besar untuk mempercepat pengujian kerentanan perangkat lunak dari hitungan hari atau minggu menjadi hitungan jam, menurut The Economic Times. Perubahan ini mencerminkan meningkatnya kecepatan pelaku dan munculnya kemampuan alat AI

CryptoFrontier1jam yang lalu

Membantah gelembung AI! CEO BlackRock: Kekurangan daya komputasi akan memunculkan “pasar futures daya komputasi”

Permintaan global untuk AI dan kebutuhan komputasi melonjak, CEO BlackRock Fink membantah adanya gelembung AI, dengan menyatakan kelangkaan daya komputasi akan melahirkan kategori aset baru bernama “komputasi berjangka”. Untuk mengikuti tren, BlackRock bekerja sama dengan Microsoft, Nvidia, dan MGX mengucurkan ratusan miliar dolar AS untuk pusat data dan infrastruktur energi; GIP membeli Aligned Data Centers dengan nilai sekitar 40 miliar dolar AS, serta berkolaborasi dengan EQT untuk akuisisi AES senilai 10,7 miliar dolar AS. Fink dan pihak lain seperti Brookfield memandang ini sebagai peluang investasi majemuk yang kokoh dalam jangka panjang, dengan imbal hasil yang dapat berlanjut selama puluhan tahun.

ChainNewsAbmedia2jam yang lalu
Komentar
0/400
Tidak ada komentar