Сообщение Gate News, 22 апреля — Hugging Face выпустила ml-intern с открытым исходным кодом: ML-агент, способный автономно завершать полный рабочий процесс — от чтения статей и организации датасетов до запуска GPU-обучения, оценки результатов и итеративного улучшения. Проект построен на фреймворке smolagents от Hugging Face и предлагает как интерфейс CLI, так и веб-интерфейс, а код доступен на GitHub.
Конвейер инструментов ml-intern разработан с опорой на экосистему Hugging Face. Он извлекает статьи из arXiv и HF Papers, одновременно отслеживая цепочки цитирования для более глубокого чтения; просматривает датасеты на HF Hub, валидирует качество и переоформляет данные для обучения; а когда локальные GPU-ресурсы недоступны, задействует HF Jobs для запуска облачных задач обучения. После завершения обучения агент автоматически читает результаты оценки, диагностирует причины неудач и повторно запускает эксперименты. По умолчанию он использует Claude Sonnet 4.5 для ведения цикла принятия решений, с максимумом 300 итераций за один запуск и автоматическим сжатием контекста при превышении 170k токенов.
Hugging Face продемонстрировала три сценария использования. В задаче научного рассуждения агент нашёл датасеты OpenScience и NemoTron-CrossThink по цепочкам цитирования, отфильтровал семь вариантов из ARC, SciQ и MMLU по уровню сложности и провёл 12 раундов контролируемого дообучения на Qwen3-1.7B, улучшив оценки GPQA с 10% до 32% менее чем за 10 часов. Для медицинского применения агент определил, что существующие датасеты недостаточны, написал скрипты для генерации 1,100 синтетических образцов данных и масштабировал их в 50 раз для обучения, превысив производительность Codex на 60% на HealthBench. В соревновательном математическом сценарии агент написал скрипт обучения GRPO и запустил обучение на A100 GPU через HF Spaces, а затем провёл исследования методом абляции после наблюдения коллапса награды.
Связанные статьи
Исследователи внедряют технологию DPN-LE для редактирования личностных черт ИИ, изменяя всего 0,5% нейронов
AI-агент Manfred создает компанию и готовит криптокошелек к торговле к концу мая
Генеральный директор Tether предлагает интеграцию WDK и QVAC для поддержки агентных карточек
Particle Network публикует дорожную карту универсальных аккаунтов, запускает Universal Deposit SDK и аккаунты AI Agent
OpenAI разрешает платную подписку ChatGPT работать на агентской платформе OpenClaw