Tim Multi-X Oppo telah menerbitkan X-OmniClaw, sebuah framework agen Android AI open-source yang menjaga logika inti di perangkat (on-device) sambil memanggil model bahasa berbasis cloud hanya untuk tugas penalaran yang berat. Berbeda dari kebanyakan sistem AI seluler yang berjalan di server cloud yang meng-host salinan Android virtual, X-OmniClaw dieksekusi langsung di perangkat fisik pengguna, sehingga tetap memiliki akses ke kamera ponsel, foto, dan file lokal.
X-OmniClaw beroperasi melalui tiga komponen yang saling terhubung dan bekerja sebagai satu loop berkelanjutan, menurut dokumentasi teknis Oppo.
Omni Perception menggabungkan feed kamera, konten layar, dan input suara ke dalam satu pipeline. Sebuah model vision-language menafsirkan adegan sebelum agen mengambil tindakan. Misalnya, jika pengguna mengarahkan kamera ke sebuah produk dan menanyakan harganya, agen terlebih dahulu mengidentifikasi apa yang sedang dilihat, lalu membuka aplikasi belanja yang relevan dan mulai mencari tanpa memerlukan input manual.
Omni Memory membedakan X-OmniClaw dari chatbot one-shot dengan menjaga konteks lintas tugas, perpindahan aplikasi, dan sesi. Agen membangun memori semantik jangka panjang dari galeri foto pengguna, mengonversi gambar mentah menjadi catatan terstruktur tentang objek, adegan, dan peristiwa. Menurut laporan tersebut, “runtime continuity adalah yang memungkinkan X-OmniClaw beroperasi sebagai agen perangkat yang berkelanjutan, bukan sebagai sistem respons one-shot.”
Omni Action menangani eksekusi dengan menggabungkan data antarmuka XML dengan model visual on-device serta optical character recognition (OCR) untuk menentukan dengan tepat apa yang harus disentuh, bahkan pada layar yang penuh. Framework ini menyertakan fitur behavior cloning yang memungkinkan pengguna merekam jalur navigasi sekali, lalu memutarnya kembali secara instan melalui shortcut Android deeplink pada sesi berikutnya, sehingga melewati navigasi aplikasi bertahap.
Oppo menunjukkan beberapa aplikasi praktis dari X-OmniClaw:
Identifikasi produk dan penetapan harga: Agen mengidentifikasi produk fisik melalui kamera, membuka Taobao, menggulir hasil, lalu mengembalikan ringkasan harga tanpa memerlukan pengetikan apa pun.
Bantuan pendidikan: Sebuah pendamping mengambang di layar membantu pengguna mengerjakan latihan matematika langkah demi langkah, secara otonom membaca konten layar, memproses setiap soal, dan maju saat sudah selesai.
Pembuatan video dari galeri: Saat diminta merakit video highlight dari foto bertema burung beo, sistem memindai galeri menggunakan memori semantik untuk menemukan gambar yang cocok, membuka editor video CapCut lewat deeplink, memilih file secara batch, lalu menghasilkan videonya. Laporan tersebut menyatakan proses ini, yang sebelumnya memerlukan “beberapa menit atau lebih,” dipangkas menjadi segelintir langkah otomatis.
X-OmniClaw memperluas arsitektur yang dipelopori oleh OpenClaw, sebuah framework agen open-source yang meraih lebih dari 373.000 bintang GitHub dan akhirnya didukung oleh OpenAI. Hermes Agent dari Nous Research mengembangkan konsep itu lebih lanjut dengan loop pembelajaran yang bisa memperbaiki diri, yang menumpuk kemampuan dari waktu ke waktu. Kedua proyek ini terutama berjalan di perangkat keras desktop. X-OmniClaw mengadaptasi arsitektur ini untuk smartphone dengan membangun di atas basis kode HermesApp open-source dan memasukkan model skill terstruktur OpenClaw sebagai inspirasi dasar, lalu menyesuaikannya untuk sifat multimodal yang selalu aktif pada perangkat seluler.
Kodenya tersedia di GitHub, dengan Oppo berkomitmen untuk merilis semua aset dan terus memperbarui proyek saat sistem berkembang.
Berita Terkait
3 Altcoin untuk Dibeli Demi Keuntungan Tinggi: Pilihan Pasar Mengincar Kenaikan 3x dalam Waktu Singkat
Hermes Agent v0.14.0 dirilis, pengguna yang berlangganan tidak perlu memanggil API Key untuk layanan-layanan arus utama
Fitur manajemen keuangan pribadi ChatGPT resmi diluncurkan di AS, sehingga Anda dapat melihat rekening bank pribadi
X merilis kode sumber algoritme rekomendasi “For You”: panduan praktis untuk mengelola akun Twitter dengan memanfaatkan algoritme
Dompet agen (agentic wallets) TON mengubah bot Telegram menjadi entitas pembelanja