Microsoft Meluncurkan Tujuh Model AI yang Mengklaim Keunggulan atas Claude dan Nano Banana

Microsoft mengungkapkan tujuh model AI baru pada acara Build tahunannya pada hari Selasa, mengklaim bahwa model-model tersebut mengungguli Claude Sonnet 4.6 milik Anthropic dan Nano Banana 2 milik Google dalam pengujian buta serta penanda kinerja pengeditan gambar. Peluncuran ini menandai upaya Microsoft untuk menegaskan posisinya sebagai pengembang AI frontier, bukan hanya sebagai pendukung terbesar dan penyedia infrastruktur OpenAI. Pengumuman ini muncul saat persaingan di antara pengembang AI terkemuka terus menguat, dengan Anthropic dan Google baru-baru ini merilis model unggulan mereka sendiri.

MAI-Thinking-1 Mengungguli Claude Sonnet 4.6 dalam Uji Buta

MAI-Thinking-1, model dasar teks andalan Microsoft, lebih dipilih daripada Claude Sonnet 4.6 milik Anthropic dalam uji buta yang dilakukan oleh evaluator independen, menurut CEO AI Microsoft Mustafa Suleyman. Model tersebut meraih skor 97% pada AIME 2025, sebuah tolok ukur yang mengukur kemampuan pemecahan masalah tingkat lanjut dan penalaran. Suleyman menyatakan bahwa hasil SWE Bench Pro model tersebut menempatkannya “tepat sejajar dengan Opus 4.6 pada salah satu tolok ukur coding tersulit.” Microsoft juga mengklaim MAI “menghasilkan tingkat kemenangan tertinggi, mengungguli GPT-5.5 dari sisi kualitas, sementara biaya 10x lebih rendah.”

“Sangat senang mengumumkan tujuh model MAI baru kelas dunia hari ini,” tulis Suleyman di X. “Mereka mewakili apa yang kami anggap sebagai era baru dalam AI yang dirancang untuk menjaga Anda tetap memegang kendali dan berada di garis depan.”

Microsoft Meluncurkan Enam Model AI Tambahan di Kategori Coding, Image, Voice

Microsoft meluncurkan MAI-Code-1-Flash, model coding ringan yang dibuat untuk GitHub Copilot dan Visual Studio Code. Perusahaan itu juga mengungkap MAI-Image-2.5 dan varian Flash-nya, yang menurut Microsoft mengungguli Nano Banana Pro milik Google dalam tugas pengeditan gambar. MAI Transcribe-1.5, model transkripsi yang mendukung 43 bahasa, dan MAI-Voice-2, model pembangkit suara yang mampu menghasilkan suara terdengar alami dalam 15 bahasa serta beradaptasi dengan pembicara dari cuplikan audio singkat, juga diumumkan.

“Ini adalah waktu yang luar biasa dalam teknologi. Komputasi yang digunakan untuk melatih model-model frontier telah meningkat dengan faktor satu triliun,” kata Suleyman dalam unggahan blog yang mengumumkan model-model baru tersebut. “Sekarang kami mengharapkan peningkatan sepuluh kali lipat lainnya dalam tiga tahun ke depan, yang pada gilirannya berarti kemampuan yang lebih canggih, serta peluncuran AI yang semakin efektif.”

Anthropic dan Google Merilis Model yang Saling Bersaing

Minggu lalu, Anthropic mengumumkan peluncuran Opus 4.8, yang kata perusahaan tersebut lebih cepat dan lebih cerdas dalam pengujian tolok ukur serta hadir dengan fitur baru. Pada hari Selasa, Anthropic mengumumkan perluasan Project Glasswing, memberi akses kepada 150 perusahaan untuk model Mythos yang berfokus pada keamanan siber. Pada Google I/O di bulan Mei, Google memperkenalkan Gemini Omni, model AI multimodal yang menggabungkan Gemini dengan model generasi media Veo, Nano Banana, dan Genie, bersama Gemini Spark, sebuah agen AI berbasis cloud yang dirancang untuk mengelola tugas di berbagai aplikasi dan alur kerja.

“Pengembang dan bisnis terus meminta AI yang memenuhi persyaratan mereka dan atas kendali mereka,” tulis Suleyman. “Kami melihat ini sebagai langkah besar menuju penyampaian hal tersebut.”

FAQ

Apa yang diumumkan Microsoft pada acara Build hari Selasa? Microsoft mengungkap tujuh model AI baru termasuk MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI Transcribe-1.5, dan MAI-Voice-2, dengan klaim bahwa model-model tersebut mengungguli Claude Sonnet 4.6 milik Anthropic dan Nano Banana 2 milik Google dalam berbagai tolok ukur.

Bagaimana performa MAI-Thinking-1 di tolok ukur? MAI-Thinking-1 meraih skor 97% pada AIME 2025 dan lebih dipilih daripada Claude Sonnet 4.6 dalam uji buta yang dilakukan oleh evaluator independen, menurut CEO AI Microsoft Mustafa Suleyman.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar