ByteDance disponibiliza em open-source um modelo multimodal de 3 mil milhões (3B) treinado em 128 GPUs A100

Segundo Beating, a pesquisa da ByteDance disponibilizou em código aberto o Lance, um modelo multimodal unificado com 3 mil milhões de parâmetros, treinado apenas em 128 GPUs A100. O Lance suporta compreensão, geração e edição de imagens e vídeo num único framework, demonstrando que capacidades multimodais avançadas podem ser alcançadas com recursos computacionais mínimos, usando uma arquitetura de mixture-of-experts de duplo fluxo e codificação de posição rotativa sensível ao modo.
Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário