Google meluncurkan Gemini Robotics ER 1.6: model robot SOTA, unggul dalam penalaran visual dan spasial

2026-04-14 18:06:15

Google DeepMind merilis model dasar robot terbaru Gemini Robotics ER 1.6, di mana ER adalah singkatan dari Embodied Reasoning (penalaran berbasis fisik). Model ini mencapai level terbaik saat ini (SOTA) dalam penalaran visual dan spasial, serta sudah tersedia melalui Gemini API. Logan Kilpatrick, petugas hubungan pengembang AI di Google, mengumumkan kabar ini di media sosial. (Sumber)

Apa itu Embodied Reasoning?

Embodied Reasoning adalah kemampuan model AI untuk memahami dan bernalar tentang dunia fisik. Berbeda dari model bahasa tradisional, model penalaran berbasis fisik perlu memproses posisi, bentuk, material, serta hubungan interaksi fisik objek dalam ruang tiga dimensi. Gemini Robotics ER 1.6 dioptimalkan khusus untuk tugas-tugas seperti ini, sehingga robot dapat memahami lingkungan sekitar dengan lebih akurat dan membuat keputusan tindakan yang tepat.

Kemampuan inti

Keunggulan utama Gemini Robotics ER 1.6 berfokus pada dua aspek:

Kemampuan Keterangan Penalaran visual Dapat mengenali objek dari gambar dan video, memahami struktur situasi, lalu membuat keputusan berdasarkan hal tersebut Penalaran spasial Memahami posisi relatif, jarak, dan arah objek dalam ruang tiga dimensi, serta mendukung perencanaan operasi yang kompleks

Kombinasi dua kemampuan ini memungkinkan robot menangani tugas dunia nyata yang lebih kompleks. Misalnya, di lingkungan gudang, robot perlu mengenali berbagai jenis barang dengan bentuk yang berbeda, serta menghitung sudut pengambilan dan posisi penempatan terbaik — ini adalah skenario yang menjadi keahlian Gemini Robotics ER 1.6.

Menggunakan Gemini API

Berbeda dari banyak model robot di masa lalu yang hanya berhenti pada tahap paper, Gemini Robotics ER 1.6 sudah menyediakan akses melalui Gemini API. Artinya, pengembang dan vendor perangkat keras dapat langsung mengintegrasikan model ini ke sistem robot mereka sendiri, tanpa perlu melatih model dari nol.

Keterbukaan API juga menurunkan ambang batas pengembangan AI robot. Di masa lalu, mengembangkan sistem robot yang memiliki kemampuan penalaran visual dan spasial membutuhkan pengumpulan data yang besar serta pekerjaan pelatihan model. Sekarang, pengembang dapat fokus pada pengembangan desain perangkat keras dan skenario penerapannya, sementara kemampuan penalaran tingkat dasar diserahkan untuk ditangani oleh Gemini Robotics ER 1.6.

Tata letak AI robot dari Google

Gemini Robotics ER 1.6 adalah hasil terbaru Google DeepMind di bidang robotika. Dari RT-2 di awal hingga rangkaian Gemini Robotics saat ini, Google terus memperluas kemampuan model bahasa besar ke interaksi dunia fisik. Versi ER 1.6 meningkatkan akurasi penalaran lebih jauh dibanding pendahulunya, terutama tampil lebih baik pada skenario yang membutuhkan operasi presisi.

Seiring industri robot memasuki fase pertumbuhan baru, model dasar dengan kemampuan penalaran visual dan spasial yang kuat akan menjadi infrastruktur kunci. Untuk mengetahui lebih lanjut perkembangan ekosistem Gemini, Anda dapat merujuk ke panduan lengkap Gemini.

Artikel ini Google meluncurkan Gemini Robotics ER 1.6: model robot SOTA yang unggul dalam penalaran visual dan spasial pertama kali muncul di Jaringan Berita ABMedia.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.