De acordo com o relatório técnico da DeepSeek, a 30 de abril a empresa apresentou Visual Primitives, um método que incorpora unidades visuais básicas como pontos e caixas delimitadoras em cadeias de raciocínio para resolver o problema da Reference Gap em tarefas multimodais. O método reduz o consumo de tokens de imagem através da compressão do KV cache.
Nos testes de contagem e raciocínio espacial, a abordagem atinge o desempenho do GPT-5.4, do Claude-Sonnet-4.6 e do Gemini-3-Flash em dimensões selecionadas. A DeepSeek afirmou que irá disponibilizar em open-source partes das benchmarks e dos conjuntos de dados, com os pesos do modelo a serem lançados após a integração.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Apoiada pela OpenAI, a 1X abre uma fábrica de 58.000 pés quadrados na Califórnia, com o objetivo de ter 10.000 robôs no primeiro ano
De acordo com a Bloomberg, a 1X Technologies, uma startup de robótica apoiada pela OpenAI e fundada na Noruega, abriu uma fábrica de 58.000 pés quadrados em Hayward, Califórnia, com o objetivo de liderar na produção em massa de robôs humanoides para consumo.
A instalação deverá produzir 10.000 robôs no seu
GateNews40m atrás
A Casa Branca prepara um memorando de política de IA que orienta as agências dos EUA a utilizarem múltiplos fornecedores de IA a 30 de abril
De acordo com fontes citadas pela PANews a 30 de abril, responsáveis da Casa Branca estão a redigir um memorando de política de inteligência artificial (IA) abrangente que orienta as agências do governo dos EUA a adotarem vários prestadores de serviços de IA e a evitarem a dependência de um único fornecedor. O memorando também exige que todas as empresas de IA contratadas
GateNews1h atrás
A Administração Estatal de Ciberespaço da China lança uma campanha de 4 meses para travar o caos nas aplicações de IA a 30 de abril
De acordo com a CCTV News, a Administração Estatal de Ciberespaço da China lançou, a 30 de abril, uma campanha nacional de quatro meses para lidar com o caos nas aplicações de IA. A iniciativa, implementada em duas fases, visa problemas como registos de modelos em falta, capacidades insuficientes de segurança e revisão das plataformas,
GateNews1h atrás
Forefront Tech conclui a definição de preços do $100M IPO, com admissão na Nasdaq sob o código FTHAU
De acordo com a ChainCatcher, a empresa de aquisição com finalidade específica Forefront Tech concluiu a definição de preço de um IPO de 100 milhões de dólares a 30 de abril e vai cotar na Nasdaq sob o símbolo FTHAU. A empresa planeia usar as receitas para perseguir oportunidades de fusões e aquisições em blockchain, fintech, inteligência artificial e no
GateNews2h atrás
O código Claude da Anthropic cobrou a um utilizador a mais 200,98 dólares devido a um erro de faturação, tendo inicialmente recusado o reembolso antes de uma compensação total
De acordo com o monitorização da Beating, um erro de faturação no serviço Claude Code da Anthropic fez com que um subscritor do Max 20x fosse cobrado a mais 200,98 USD em taxas adicionais de utilização, apesar de apenas utilizar 13% da sua quota mensal. O bug foi despoletado quando o histórico de commits do repositório git de um utilizador continha o caractere em maiúscula
GateNews3h atrás
A NVIDIA lança os pesos do modelo flagship Cosmos-Reason2-32B e alarga a janela de contexto para 256K tokens
Segundo Beating, a NVIDIA lançou os pesos do Cosmos-Reason2-32B, a versão de topo da sua visão-linguagem de raciocínio físico (VLM), concebida para ajudar robôs e sistemas de condução autónoma a compreenderem princípios espaciais, temporais e físicos. O modelo de 32 mil milhões de parâmetros,
GateNews3h atrás