Mensagem da Gate News, 22 de abril — A Hugging Face disponibilizou em código aberto o ml-intern, um agente de investigação em ML capaz de concluir autonomamente todo o fluxo de trabalho, desde a leitura de artigos, passando pela organização de conjuntos de dados, lançamento de treino em GPU, avaliação de resultados e iteração de melhorias. O projeto é construído sobre o framework smolagents da Hugging Face e oferece tanto interfaces de CLI como baseadas na web, com código disponível no GitHub.
O conjunto de ferramentas do ml-intern foi concebido em torno do ecossistema da Hugging Face. Obtém artigos de arXiv e HF Papers enquanto traça cadeias de citações para uma leitura mais aprofundada; navega por conjuntos de dados no HF Hub, valida a qualidade e reformata os dados para treino; e, quando os recursos de GPU locais não estão disponíveis, recorre a HF Jobs para lançar tarefas de treino na cloud. Após a conclusão do treino, o agente lê automaticamente as saídas de avaliação, diagnostica as causas de falha e volta a executar experiências. Por padrão, utiliza Claude Sonnet 4.5 para conduzir o ciclo de decisão, com um máximo de 300 iterações por execução e compressão automática de contexto quando excede 170k tokens.
A Hugging Face demonstrou três casos de uso. Numa tarefa de raciocínio científico, o agente identificou os conjuntos de dados OpenScience e NemoTron-CrossThink a partir de cadeias de citação, filtrou sete variantes do ARC, SciQ e MMLU por nível de dificuldade e realizou 12 rondas de fine-tuning supervisionado no Qwen3-1.7B, melhorando as pontuações do GPQA de 10% para 32% em menos de 10 horas. Para uma aplicação médica, o agente concluiu que os conjuntos de dados existentes eram insuficientes, escreveu scripts para gerar 1.100 amostras de dados sintéticos e escalou-os 50 vezes para treino, ultrapassando o desempenho do Codex em 60% no HealthBench. Num cenário de matemática competitiva, o agente escreveu um script de treino em GRPO e lançou o treino em GPUs A100 via HF Spaces, e depois conduziu estudos de ablação após observar a colapsagem da recompensa.
Related Articles
Investigadores Implementam a tecnologia DPN-LE para Editar Traços de Personalidade de IA, Editando Apenas 0,5% dos Neurónios
O agente de IA Manfred forma empresa, prepara uma carteira de criptomoedas para negociar até ao final de maio
O CEO da Tether propõe a integração da WDK e da QVAC para suportar cartões de agentes
Particle Network lança roteiro de contas universais, disponibiliza o Universal Deposit SDK e lança contas de agentes de IA
A OpenAI permite que as subscrições do ChatGPT funcionem na plataforma de agentes OpenClaw
O agente de IA Manfred cria empresa e prepara-se para fazer trading de criptomoedas até ao final de maio