Menurut riset dari Zhejiang University yang dipresentasikan pada Simposium IEEE ke-47 tentang Keamanan dan Privasi di San Francisco, para peneliti mengembangkan AudioHijack, yang menyembunyikan perintah yang tidak disadari manusia dalam audio untuk memanipulasi model bahasa audio skala besar dengan tingkat keberhasilan 79-96%.
Serangan ini memodifikasi gelombang audio digital dengan cara yang tidak terlihat oleh manusia, tetapi mengubah cara AI menafsirkan sinyal, sehingga memungkinkannya menimpa perilaku model meski terdapat instruksi pengguna yang sah. Para peneliti menguji AudioHijack pada 13 model suara sumber terbuka dan sistem komersial dari Microsoft dan Mistral, menemukan bahwa serangan ini dapat memaksa model menolak permintaan, menyebarkan informasi palsu, menyisipkan tautan berbahaya, atau menjalankan tindakan yang tidak berwenang seperti penelusuran web dan pengunduhan file.