O laboratório chinês de IA DeepSeek está em conversações para angariar a sua primeira ronda de financiamento, a uma avaliação divulgada de 45 mil milhões de dólares, segundo a TechCrunch. A avaliação representa um aumento significativo face a uma avaliação estimada de 20 mil milhões de dólares apenas semanas antes, na sequência da atenção que os modelos de IA da empresa atraíram pelos seus custos de treino mais baixos. O fundador Liang Wenfeng controla quase 90% da empresa.
A DeepSeek decidiu procurar financiamento depois de concorrentes terem tentado recrutar investigadores oferecendo ações da empresa como incentivo. O China Integrated Circuit Industry Investment Fund poderá liderar a ronda, enquanto a Tencent e a Alibaba também estarão, segundo informações, em conversações para participar.
O modelo V4 da DeepSeek é referido como tendo desempenho equivalente ao dos principais modelos da OpenAI e da Anthropic em testes de benchmark, de acordo com a empresa. A vantagem competitiva estende-se à precificação: o V4-Pro custa 1,74 dólares por milhão de tokens de entrada, enquanto o V4-Flash custa aproximadamente 0,14 dólares por milhão de tokens de entrada — significativamente abaixo do preço de modelos US comparáveis.
A estrutura de custos mais baixa resulta da arquitetura eficiente em computação da DeepSeek, incluindo um design de mistura de especialistas (MoE) que ativa apenas parte do modelo para cada tarefa, reduzindo as necessidades de computação durante a inferência. Segundo a DeepSeek, o V4-Pro utiliza 27% do poder de computação e 10% da memória exigidos pelo V3.2.
A ronda de financiamento da DeepSeek ocorre enquanto a China procura construir uma infraestrutura de IA mais auto-suficiente, em resposta aos controlos de exportação dos EUA sobre chips avançados. O V4 é o primeiro modelo da DeepSeek afinado para chips chineses, como a série Ascend da Huawei, embora o relatório técnico da empresa indique que os chips chineses fazem a inferência, enquanto o treino poderá ainda depender principalmente do hardware da Nvidia.
A DeepSeek também disponibiliza modelos com pesos abertos — parâmetros treinados que outros podem usar, afinar e implementar — alargando o desenvolvimento de IA para além da dominância dos EUA. Esta estratégia dá ênfase à eficiência algorítmica em vez do acesso exclusivo ao hardware mais avançado dos EUA, embora o impulso da IA da China continue a depender parcialmente do hardware da Nvidia.
Related Articles
a16z lança 5.ª ronda de um fundo cripto de 2,2 mil milhões de dólares, com investimento principal em três novas empresas de IA
Cursor contrata o antigo executivo da Palo Alto Networks, Simon Green, para liderar a expansão na Ásia
O fundador da Pi Network participa na Consensus 2026 e faz uma apresentação sobre verificação de identidade na era da IA
A Apple concordou em pagar 250 milhões de dólares, num acordo sobre ações coletivas relacionadas com a Apple Intelligence
Antevisão do Tencent Hunyuan Hy3 regista um crescimento de tokens 10x em duas semanas