Mensagem do Gate News, 25 de abril — O DeepSeek lançou versões de prévia de V4-Pro e V4-Flash em 24 de abril, ambos modelos de pesos abertos com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 trilhão de parâmetros no total, mas ativa apenas 49 bilhões por passagem de inferência usando uma arquitetura de Mixture-of-Experts. O V4-Flash tem 284 bilhões de parâmetros no total com 13 bilhões ativos.
Os preços são significativamente mais baixos do que os concorrentes: o V4-Pro custa US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de tokens de saída—aproximadamente 98% menos do que o GPT-5.5 Pro da OpenAI ($30 input, $180 output) e cerca de um-vigésimo do custo do Claude Opus 4.7. O V4-Flash é precificado em US$ 0,14 de entrada e US$ 0,28 de saída por milhão de tokens. Ambos os modelos são open-source sob licença MIT e podem ser executados localmente gratuitamente.
O DeepSeek obteve ganhos de eficiência por meio de dois novos mecanismos de atenção: Compressed Sparse Attention e Heavily Compressed Attention, que reduzem os custos de computação para 27% do predecessor V4-Pro (V3.2) e 10% para o V4-Flash. A empresa treinou o V4 parcialmente em chips Huawei Ascend, contornando as restrições de exportação dos EUA a processadores Nvidia avançados. O DeepSeek afirmou que, uma vez que 950 novos supernós entrem em operação mais tarde em 2026, o preço cairá ainda mais.
Em benchmarks de desempenho, o V4-Pro-Max fica em primeiro lugar no Codeforces competitive programming (3.206 score, ficando em torno de 23º entre os competidores humanos) e obtendo 90,2% em problemas de matemática do Apex Shortlist versus 85,9% do Claude Opus 4.6. No entanto, fica para trás em benchmarks de multitarefa: MMLU-Pro (87,5% vs 91,0% do Gemini-3.1-Pro) e Humanity’s Last Exam (37,7% vs 44,4%). Em tarefas de longo contexto, o V4-Pro lidera modelos open-source, mas perde para o Claude Opus 4.6 em testes de recuperação MRCR.
O V4-Pro introduz o “interleaved thinking,” permitindo que fluxos de trabalho de agentes retenham contexto de raciocínio entre múltiplas chamadas de ferramentas sem descarregar entre as etapas. Ambos os modelos oferecem integrações de codificação com Claude Code e OpenCode. De acordo com a pesquisa com desenvolvedores do DeepSeek com 85 usuários, 52% disseram que o V4-Pro estava pronto como seu agente padrão de codificação, com 39% inclinados a adotar. Os endpoints antigos deepseek-chat e deepseek-reasoner serão descontinuados em 24 de julho de 2026.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
A OpenAI Lança Protocolo de Rede MRC com AMD, Intel e NVIDIA; Suporta 100.000+ GPUs
De acordo com o anúncio da OpenAI em 6 de maio, a empresa fez parceria com a AMD, Broadcom, Intel, Microsoft e NVIDIA para lançar o Multipath Reliable Connection (MRC), um protocolo de rede aberto para interconexão de GPUs em clusters de treinamento de IA em larga escala. O protocolo divide uma única transmissão de dados em múltiplos caminhos
GateNews17m atrás
As ações da Hut 8 disparam 30% no pré-mercado após assinar um acordo de locação de data center de IA no valor de US$ 9,8 bilhões
De acordo com o The Block, as ações da Hut 8 Corp. dispararam mais de 30% no pré-mercado após a empresa assinar um acordo de arrendamento de US$ 9,8 bilhões para um campus de data center de inteligência artificial no condado de Nueces, no Texas, projetado para a arquitetura de computação da NVIDIA. O inquilino não identificado vai usar o
GateNews36m atrás
CleanSpark CTO: A infraestrutura de IA/HPC exige mais recursos de rede do que a mineração de Bitcoin
Em uma entrevista ao CoinDesk, o diretor de tecnologia (CTO) da CleanSpark, Taylor Monnig, afirmou que a transição da mineração de Bitcoin para a infraestrutura de IA/HPC exige mais redundância e menos improviso. “A fibra de rede de um único rack supera a de toda uma instalação de mineração de Bitcoin”, Monnig
GateNews41m atrás
A Public adquire o aplicativo Treasury, plataforma de investimentos em IA
De acordo com a Foresight News, o aplicativo de investimentos Public anunciou a aquisição da plataforma de investimentos orientada por IA Treasury App em 6 de maio. O valor da aquisição não foi divulgado. O acordo tem como objetivo fortalecer as operações de corretagem impulsionadas por IA da Public, que atualmente oferece suporte a ações, títulos e
GateNews1h atrás
MiroMind interrompe o serviço MiroThinker na Grande China a partir de 12 de maio
De acordo com a BlockBeats, a MiroMind, empresa de pesquisa em IA fundada por Chen Tianqiao, fundador do Grupo Shanda, vai suspender seu serviço MiroThinker (versões para web e aplicativo móvel) na China continental, Hong Kong e Macau a partir de 12 de maio de 2026. A data da suspensão e o cronograma de recuperação foram anunciados via
GateNews1h atrás
ChatGPT disponibiliza integração com Excel e Google Sheets: GPT-5.5 entra direto na planilha, confronto entre Copilot e Gemini
A OpenAI lançou plug-ins do ChatGPT for Excel e do ChatGPT for Google Sheets, usando o motor GPT-5.5; o foco é “explicar enquanto faz”. As funcionalidades incluem análise, escrever fórmulas automaticamente, atualizar planilhas e detalhar o processo de raciocínio passo a passo, permitindo que os usuários tratem e entendam diretamente dentro da planilha. Em meio a uma disputa em três frentes com Copilot e Gemini, o lançamento marca um novo cenário para IA de produtividade corporativa; usuários em Taiwan precisam instalar via AppSource/Workspace Marketplace e devem ficar atentos à privacidade dos dados e se será necessário o ChatGPT Plus.
ChainNewsAbmedia2h atrás