GLM-5.1 atinge o topo do ranking de código do LMArena: 1.º lugar em open source e 3.º a nível global

Notícias do Gate News, a 10 de abril. Hoje, a plataforma global de avaliação de IA de referência LMArena (plataforma de avaliação de modelos de IA com testes cegos, com participação de milhões de utilizadores) atualizou a tabela de classificação especializada do Code Arena: o GLM-5.1 ficou em primeiro lugar entre os modelos abertos a nível mundial, e em terceiro lugar na classificação global de modelos.

O GLM-5.1 não só herdou as capacidades de codificação em código aberto SOTA da geração anterior, como também alcançou um avanço nas tarefas de longo alcance (Long-Horizon Task), realizando: a construção, do zero, de um ambiente de trabalho Linux em 8 horas; 655 iterações para ultrapassar o gargalo de otimização de uma base de dados vetoriais; e 1000 rondas de chamadas a ferramentas para otimizar a carga de modelos de aprendizagem automática reais.

A destacar ainda que, sob critérios de avaliação equivalentes na tabela METR, o GLM-5.1 é o único modelo aberto a atingir trabalho contínuo ao nível de 8 horas, e é também um dos poucos modelos no mundo, para além do Claude Opus 4.6, com esta capacidade.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Pesquisa da Microsoft: apenas 13% dos colaboradores dizem ter falhado iniciativas de inovação no local de trabalho impulsionadas por IA devido a incentivos às empresas

De acordo com o relatório anual «Índice de Tendências do Trabalho», publicado pela Microsoft a 5 de maio, o relatório analisou vários biliões de sinais anónimos de produtividade do Microsoft 365 e recorreu a um inquérito a 20.000 colaboradores em vários mercados, incluindo os EUA, o Reino Unido, a Índia e o Japão. Os dados do relatório indicam que apenas 13% dos colaboradores afirmam que os seus empregadores atribuem recompensas quando as tentativas de melhorar o trabalho com IA não produzem os resultados esperados.

MarketWhisper3m atrás

A Meta está a desenvolver um assistente de IA chamado Hatch, em concorrência com a OpenClaw, com conclusão do teste interno até ao final de junho

De acordo com o Financial Times, a 5 de Maio, a Meta está a desenvolver um assistente de IA (Hatch) para o utilizador comum, inspirado no OpenClaw da OpenAI, com o objetivo de concluir testes internos até ao final de Junho; a Meta planeia, ao mesmo tempo, integrar uma ferramenta autónoma de compras baseada em agentes no serviço Instagram até ao quarto trimestre deste ano.

MarketWhisper12m atrás

A audiência do tribunal da OpenAI: Brockman depõe: Musk já disse que não ia fazer segurança e que as participações seriam de risco e com violência

De acordo com o “New York Post”, em 6 de maio, o CEO da OpenAI, Greg Brockman, depôs no dia 5 de maio no Tribunal Distrital Federal de Oakland, na Califórnia, revelando que, quando Musk se retirou do conselho de administração da OpenAI em 2018, proferiu um discurso para todos, dizendo que, ao impulsionar a IA na Tesla, “não vai gastar tempo em segurança”. Brockman também afirmou que, em 2017, houve negociações tensas com o cofundador da OpenAI sobre percentagens de participação.

MarketWhisper1h atrás

Empresas indianas de cibersegurança usam IA para reduzir os testes de vulnerabilidades para horas

As empresas indianas de cibersegurança, incluindo a Indusface e a Astra Security, estão a adotar agentes de IA baseados em grandes modelos de linguagem para acelerar os testes de vulnerabilidades de software, de dias ou semanas para horas, segundo o The Economic Times. A mudança reflete a crescente rapidez dos atacantes e a capacidade emergente das ferramentas de IA

CryptoFrontier1h atrás

Refuta a bolha da IA! CEO da BlackRock: a escassez de capacidade de computação vai dar origem a um “mercado de futuros de capacidade de computação”

A procura global por IA e por necessidades de computação disparou, e o CEO da BlackRock, Fink, refutou a ideia de uma “bolha de IA”, afirmando que a escassez de capacidade de computação dará origem a uma nova classe de ativos, os “futuros de capacidade de computação”. Para acompanhar a tendência, a BlackRock, em parceria com a Microsoft, a NVIDIA e a MGX, investe centenas de milhares de milhões de dólares em infraestruturas de centros de dados e energia; a GIP adquire a Aligned Data Centers por cerca de 40 mil milhões de dólares e, em conjunto com a EQT, compra a AES por 10,7 mil milhões de dólares. Fink e outros, como a Brookfield, consideram que se trata de uma oportunidade de investimento em capitalização composta, sólida e de longo prazo, com retornos sustentáveis ao longo de décadas.

ChainNewsAbmedia2h atrás
Comentar
0/400
Nenhum comentário