Qwable 27B: локальная ИИ-модель воспроизводит рассуждения Fable 5 на потребительском оборудовании

Разработчик Mia выпустила Qwable 27B на Hugging Face — полный дообученный вариант Qwen3.6-27B от Alibaba, обученный на датасете с рассуждениями в стиле Fable 5, после объявления от 15 июня 2026 года. Модель воспроизводит структурированный подход к мышлению Fable 5 от Anthropic, при этом полностью работает на локальном оборудовании без затрат на API и без обязательных политик сохранения данных. Незадолго после этого открытый вкладчик Huihui-ai опубликовал абли-трированную версию, которая убирает встроенное поведение отказа, изменяя веса с помощью cvector-generator из llama.cpp. Релизы последовали за неделей, в течение которой правительство США распорядилось отозвать Fable 5 для всех иностранных граждан из‑за спорного факта о джейлбрейке. Оба варианта Qwable предоставляют локальные альтернативы облачным сервисам ИИ, устраняя зависимости от серверов и требования к обработке данных сторонними организациями.

Qwable 27B Архитектура и методология обучения

Qwable 27B — это полный дообученный вариант базовой модели Qwen3.6-27B от Alibaba, созданный разработчиком Mia на датасете примеров рассуждений в стиле Fable 5. Подход к обучению — instruction fine-tuning на примерах в формате trace, где разработчик собирал примеры, оформленные как пошаговые ответы Fable 5, и обучал Qwen выдавать схожие структуры выходных данных. Получившаяся модель на 27 миллиардов параметров ориентирована на структуру следования инструкциям Fable 5, выдавая более направленные, поясняющие и пошаговые результаты выполнения задач по сравнению с базовой моделью Qwen.

Модель работает в формате GGUF — сжатом типе файла, совместимом с LM Studio и llama.cpp. Сборка в квантизации Q4 требует примерно 16,5 GB хранения. Вся обработка происходит локально без отправки данных на внешние серверы, что исключает обязательное требование Fable 5 по хранению данных в течение 30 дней для всего трафика, включая корпоративных клиентов, у которых ранее были соглашения о нулевом удержании.

Аблитирование устраняет механизмы отказа

Huihui-ai применил аблитирование, чтобы получить Huihui-Qwable-3.6-27b-abliterated — вариант, устраняющий поведение отказа модели. Процесс находит направление отказа, встроенное в веса модели, прогоняя модель на больших наборах вредоносных и безвредных подсказок, измеряя различия во внутренних активациях, а затем изменяя веса, чтобы устранить это различие. После аблитирования модель больше не содержит математических сигналов, которые запускают ответы-отказы.

Huihui-ai применил технику напрямую к Qwable GGUF с помощью cvector-generator из llama.cpp, не требуя Python-среды, полного перевыведения весов или арендуемых серверов. Процесс отличается от джейлбрейка тем, что навсегда модифицирует архитектуру модели, а не эксплуатирует уязвимости подсказок. В карточке модели указано, что аблитированный вариант предназначен только для исследований и контролируемых сред, при этом юридическая и этическая ответственность полностью возлагается на пользователей.

Доступные сборки и требования к оборудованию

Аблитированный Qwable доступен на Hugging Face в трех сборках. Рекомендуемая версия Q4_K_M_Q8 весит примерно 19 GB и представляет собой самый маленький и удобный вариант для обычных пользователей. Версия, поддерживающая многотокенное предсказание, доступна для систем с достаточными вычислительными ресурсами, обеспечивая более быстрое генерирование ответов. И стандартный Qwable, и аблитированный вариант работают на пользовательском оборудовании через локальные рантаймы вроде LM Studio.

Сценарии использования стандартной и аблитированной версий

Стандартный Qwable подходит для помощи в кодинге, технической отладки и рабочих процессов, где нужны модели, показывающие процессы рассуждений, а не выдающие прямые ответы. Он запускается в локальных агентских настройках и в большинстве локальных рантаймов. Аблитированная версия предназначена для исследователей безопасности, которым требуется «сырое» поведение модели без фильтрации на стороне провайдера, для конвейеров с синтетическими данными, которым нужны выводы по чувствительным темам, и для работ по оценке, где тестируются возможности модели без вмешательства контентной политики. В карточке модели предупреждается, что уменьшенная фильтрация безопасности означает, что выводы могут быть чувствительными, спорными или неуместными.

FAQ

Что такое Qwable 27B и когда он был выпущен?

Qwable 27B — это полный дообученный вариант Qwen3.6-27B от Alibaba, обученный на датасете рассуждений в стиле Fable 5; он был анонсирован разработчиком Mia 15 июня 2026 года. Модель работает локально в формате GGUF и требует примерно 16,5 GB в своей квантизированной сборке Q4.

Чем аблитированная версия отличается от стандартной модели Qwable?

Аблитированная версия, созданная Huihui-ai, убирает поведение отказа, изменяя веса модели с помощью cvector-generator из llama.cpp. Процесс устраняет математические сигналы, которые запускают ответы-отказы, в результате чего модель обрабатывает все подсказки без контентной фильтрации, сохраняя полную функциональность.

Какие требования к оборудованию нужны для запуска моделей Qwable?

Квантизированная сборка Q4 требует примерно 16,5 GB хранения, а рекомендуемая аблитированная версия Q4_K_M_Q8 весит около 19 GB. Обе модели работают на пользовательском оборудовании через локальные рантаймы вроде LM Studio или llama.cpp; для систем с более высокой вычислительной мощностью доступна версия с многотокенным предсказанием.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев