A Alibaba corta em 80% o preço do Qwen3.7-Plus, trocando o código fechado por custos mais baixos

Qwen3.7-Plus降價

A série Qwen da Alibaba, Qianwen, publicou nesta semana o modelo Qwen3.7-Plus. O preço de entrada é de US$ 0,40 por 1 milhão de tokens e o de saída é de US$ 1,60 por 1 milhão de tokens, totalizando US$ 2,00. Isso representa uma queda de 80% em relação ao Qwen3.7-Max. Para entradas com cache, o preço pode ser reduzido para US$ 0,04 por 1 milhão de tokens, com foco em cenários de tarefas de alta frequência e repetitivas.

Qwen3.7-Plus confirma as tarifas de cobrança em cada modelo

De acordo com as informações de preços publicadas pela Alibaba:

Entrada padrão: US$ 0,40 por 1 milhão de tokens

Saída padrão: US$ 1,60 por 1 milhão de tokens

Total (entrada + saída): US$ 2,00

Entrada com cache: US$ 0,04 por 1 milhão de tokens (aplicável a cenários de agentes com leitura repetida do mesmo repositório de código ou a agentes com cenários de UI empresarial)

Comparativo: o Qwen3.7-Max tem entrada de US$ 2,50, saída de US$ 7,50, totalizando US$ 10,00. Concorrentes chineses, como o MiniMax-M3, oferecem um desconto por tempo limitado, com total de US$ 1,50. O preço do Qwen3.7-Plus fica alinhado de perto com esse valor.

Números de testes de referência oficiais (autoavaliação)

A seguir estão os números de referência do Qwen3.7-Plus publicados oficialmente pela Alibaba; todos são dados de autoavaliação:

Terminal Bench 2.0-Terminus: 70,3 (DeepSeek-V4-Pro Max é 67,9; Gemini-3.1 Pro é 63,5)

ScreenSpot Pro (visão computacional e compreensão de interface): 79,0 (GPT-5.4 xhigh é 67,4; Claude-Opus-4.6 é 49,5)

Vale notar que a documentação oficial da Alibaba também afirma que o desempenho geral do Qwen3.7-Plus ainda fica abaixo da maioria dos modelos fechados líderes dos EUA. Os números acima são comparações pontuais de tarefas específicas e não representam desempenho abrangente.

Impacto da confirmação de implantação em modelo fechado: considerações de conformidade e limitações de uso

O Qwen3.7-Plus não fornece pesos do modelo de código aberto para download. Todas as chamadas de API precisam ser processadas pelos nós internacionais da Alibaba Cloud; os dados não fluem além do servidor do usuário. Com base nessa arquitetura, os seguintes cenários têm obstáculos claros de conformidade:

Indústrias com restrições de soberania de dados ou regulatórias: saúde (HIPAA, GDPR), defesa e órgãos governamentais exigem avaliação se o roteamento da API externa atende aos requisitos de conformidade

Cenários de implantação com isolamento de rede interna: não é possível implantar em um ambiente local totalmente isolado

Por outro lado, a vantagem do modo de API fechada é que não é necessário construir um cluster próprio de múltiplas GPUs (como Nvidia H100) para aquisição e manutenção de hardware. Além disso, o formato compatível com OpenAI minimiza o custo de alteração da infraestrutura existente.

Perguntas frequentes

Para quais cenários a tarifa de cache de US$ 0,04 por 1 milhão de tokens do Qwen3.7-Plus se aplica?

A tarifa de cache se aplica a cenários em que um agent lê repetidamente a mesma entrada, como acesso contínuo ao mesmo repositório de código, templates fixos de UI empresarial ou prompts do sistema mantidos por longos períodos. Em fluxos de trabalho grandes e de alta frequência e repetitividade, o mecanismo de cache pode reduzir significativamente o custo total de API. A Alibaba não divulgou detalhes específicos sobre garantias de taxa de acerto de cache nem restrições de uso.

Quais são as principais diferenças entre o Qwen3.7-Plus e as versões anteriormente abertas do Qwen?

Antes, a série Qwen era lançada com licença Apache 2.0, permitindo baixar pesos do modelo para implantação local, ajuste fino e integração aos próprios sistemas. O Qwen3.7-Plus oferece acesso apenas via API da Alibaba Cloud, sem publicar pesos do modelo. Isso significa que não é possível implantar localmente ou em redes isoladas; todo uso depende da infraestrutura externa da Alibaba Cloud.

Como interpretar a credibilidade dos números de testes de referência oficiais do Qwen3.7-Plus?

A descrição oficial do Qwen3.7-Plus deixa claro que ranqueamentos como Terminal Bench e ScreenSpot Pro são números de autoavaliação da Alibaba, e que o desempenho geral ainda fica abaixo da maioria dos modelos fechados líderes dos EUA. Os números do benchmark refletem desempenho pontual em tarefas específicas e não representam latência fim a fim, estabilidade ou desempenho abrangente em ambientes reais de produção.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários