Mensagem do Gate News, 20 de abril — Os principais modelos de IA destacam-se na resolução de problemas complexos, como a matemática das olimpíadas, mas têm dificuldades com o trabalho empresarial rotineiro, de acordo com David Meyer da Databricks. Alguns modelos podem corrigir um número de factura incorrecto em vez de o sinalizarem como erro, enquanto ferramentas de programação como a Claude também podem ter desempenho inferior em tarefas de engenharia de dados.

A lacuna resulta de diferenças fundamentais entre os dados empresariais e o texto público da web usado para treinar grandes modelos. Os dados empresariais têm frequentemente rótulos de colunas pouco claros, inúmeras campos em branco e códigos armazenados como texto simples. Num estudo académico, a pontuação F1 de um modelo de IA, que equilibra precisão e recall, caiu de 0.94 em dados públicos para 0.07 em dados empresariais para uma tarefa de engenharia de dados. Além disso, grandes modelos tendem a recorrer por defeito a padrões familiares do treino; alguns deram como resposta Structured Query Language (SQL) mesmo depois de receber instruções e documentação para a linguagem proprietária de consultas de uma empresa.

Modelos de código aberto mais pequenos, ajustados com aprendizagem por reforço, conseguem lidar com tarefas específicas com mais eficiência e a custos de treino significativamente inferiores do que modelos gerais maiores. A Databricks está a construir agentes de IA mais pequenos para fluxos de trabalho específicos, como o KARL, que usa aprendizagem por reforço para raciocínio multi-etapas com documentos da empresa. A indústria está a passar da dependência de modelos gigantes para arquitecturas híbridas, em que modelos pequenos e eficientes tratam o volume rotineiro e, só depois, elevam apenas os casos pouco claros ou complexos para sistemas maiores e mais dispendiosos.

A Databricks adquiriu recentemente a Quotient AI para ajudar grandes empresas a executar agentes de IA com mais fiabilidade. A concorrência no negócio de IA centra-se agora em gerir todo o ciclo de vida da IA, incluindo sistemas de feedback para monitorizar erros e melhorar continuamente os modelos ao longo do tempo, tornando ferramentas de avaliação e afinação cada vez mais valiosas após a implementação.

Ver fonte

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

04-20 04:51

Governador de Maryland recebe a Microsoft e líderes de IA para discutir riscos de cibersegurança de IA avançada

04-20 01:46

O volume de chamadas de modelos de IA da China desce 23,8% semana a semana; os EUA ultrapassam pela primeira vez em dois meses

04-18 01:01

Relatórios de Bugs Gerados por IA Sobrecarregam a Equipa de Manutenção do cURL

04-17 23:01

A DeepSeek procura $300M a uma $10B avaliação, enquanto as avaliações da OpenAI e da Anthropic alimentam o debate do mercado

04-17 09:21

A OpenAI Actualiza o Codex para um Agente de IA que Controla o Ambiente de Trabalho, Automatizando os Fluxos de Trabalho de Desenvolvimento

Comentar

0/400

Nenhum comentário