استناداً إلى بحث من جامعة تشجيانغ نُوقش في المؤتمر السابع والأربعين لندوة IEEE للأمن والخصوصية في سان فرانسيسكو، طوّر الباحثون AudioHijack، الذي يخفي أوامر غير ملحوظة في الصوت للتلاعب بالنماذج الكبيرة لفهم اللغة الصوتية بنسبة نجاح تتراوح بين 79-96%.
تُعدّل الهجمة موجات الصوت الرقمية بطرق غير محسوسة للبشر، لكنها تغيّر كيفية تفسير الذكاء الاصطناعي للإشارة، ما يسمح بتجاوز سلوك النموذج حتى عند وجود تعليمات المستخدم المشروعة. اختبر الباحثون AudioHijack على 13 نموذجاً صوتياً مفتوح المصدر وعلى أنظمة تجارية من Microsoft وMistral، ووجدوا أنه يمكنه إجبار النماذج على رفض الطلبات، ونشر معلومات مضللة، وإدراج روابط خبيثة، أو تنفيذ إجراءات غير مصرح بها مثل إجراء عمليات بحث على الويب وتنزيل الملفات.