
Серия Alibaba Qianwen (Qwen) на этой неделе выпустила модели Qwen3.7-Plus: цена на вход — 0,40 доллара за 1 миллион токенов, на выход — 1,60 доллара за 1 миллион токенов; в сумме 2,00 доллара, что на 80% ниже, чем у Qwen3.7-Max. Цена на вход с кэшированием может быть снижена до 0,04 доллара за 1 миллион токенов; целевые сценарии — высокочастотные повторяющиеся задачи.
Qwen3.7-Plus подтверждение цен: тарифы в разных режимах тарификации
Согласно официальным опубликованным Alibaba тарифным данным:
Обычный вход:0,40 доллара за 1 миллион токенов
Обычный выход:1,60 доллара за 1 миллион токенов
Итого (вход+выход):2,00 доллара
Вход с кэшем:0,04 доллара за 1 миллион токенов(применяется для сценариев агентом в условиях повторного чтения одного и того же репозитория кода или корпоративного UI)
Сопоставление:у Qwen3.7-Max вход стоит 2,50 доллара, выход — 7,50 доллара, в сумме 10,00 доллара. Китайские конкуренты MiniMax-M3 в рамках временной скидки дают в сумме 1,50 доллара; цена Qwen3.7-Plus плотно следует за этим уровнем.
Числа официальных базовых тестов (самооценка)
Ниже приведены числа для базовых тестов Qwen3.7-Plus, опубликованные Alibaba, это данные самооценки:
Terminal Bench 2.0-Terminus:70,3(DeepSeek-V4-Pro Max — 67,9、Gemini-3.1 Pro — 63,5)
ScreenSpot Pro(компьютерное зрение и понимание интерфейса):79,0(GPT-5.4 xhigh — 67,4、Claude-Opus-4.6 — 49,5)
Стоит отметить, что в документации Alibaba также указано: в целом производительность Qwen3.7-Plus всё еще ниже, чем у большинства ведущих американских закрытых моделей; приведенные цифры — точечные сравнения для отдельных задач и не отражают всестороннюю производительность.
Подтверждение влияния на закрытое развертывание: вопросы соответствия и ограничения применения
Qwen3.7-Plus не предоставляет загружаемые веса открытой модели: все вызовы API нужно обрабатывать через международные узлы Alibaba Cloud, при этом данные не покидают пользовательские серверы. В рамках данной архитектуры для следующих сценариев существуют явные барьеры по соответствию:
Отрасли, ограниченные суверенитетом данных или нормативами:медицина (HIPAA, GDPR), оборона, госорганы — необходимо оценить, соответствует ли маршрутизация внешнего API требованиям комплаенса
Сценарии развертывания с изоляцией во внутренней сети:невозможно развернуть в полностью изолированной локальной среде
И наоборот, преимущество закрытого режима API заключается в том, что нет необходимости самостоятельно закупать и обслуживать аппаратное обеспечение для большого GPU-кластера (например, Nvidia H100), а формат, совместимый с OpenAI, минимизирует стоимость изменений в текущей инфраструктуре.
Частые вопросы
Для каких сценариев подходит кэш-тариф Qwen3.7-Plus — 0,04 доллара за 1 миллион токенов?
Тариф на кэширование подходит для сценариев, где agent многократно читает одни и те же входные данные, например, при постоянном доступе к одному и тому же репозиторию кода, использовании фиксированных корпоративных UI-шаблонов или при длительном удержании системных подсказок. В крупных рабочих процессах с высокой частотой повторения механизм кэширования может существенно снизить общую стоимость API. Alibaba не публиковала конкретные гарантии по коэффициенту попадания в кэш или детали ограничений на использование.
В чем ключевые отличия Qwen3.7-Plus от предыдущих версий Qwen с открытой лицензией?
Ранее Qwen выпускали серию с лицензией Apache 2.0, предоставляя загружаемые веса модели, которые позволяли любому развертывать модель локально, выполнять дообучение и интегрировать в собственные системы. Qwen3.7-Plus доступен только через API Alibaba Cloud, не публикует веса модели, то есть его нельзя развернуть локально или в изолированной сети; всё использование зависит от внешней инфраструктуры Alibaba Cloud.
Как следует интерпретировать достоверность чисел официальных базовых тестов Qwen3.7-Plus?
В официальных пояснениях Qwen3.7-Plus прямо указано, что прогоновые рейтинги вроде Terminal Bench и ScreenSpot Pro — это самооценочные цифры Alibaba, и в целом производительность по-прежнему ниже, чем у большинства ведущих американских закрытых моделей. Числа базовых тестов отражают точечную производительность в рамках конкретных задач и не представляют реальную сквозную задержку, стабильность или всестороннюю производительность в условиях производства.