Cursor раскрывает метод обучения «самозакрепления»: использование старого Composer для создания среды для новой модели, Terminal-Bench вырос на 14 пунктов

BlockBeatNews

2026-05-07 10:50:58

По данным мониторинга Beating, Cursor опубликовал один из тренировочных трюков серии моделей Composer: использование предыдущего поколения модели для автоматической сборки рабочей среды для следующего поколения с помощью обучения с подкреплением (RL). При обучении Composer 2 Cursor использовал Composer 1.5 для выполнения этой задачи, называя это autoinstall.

Обучение с подкреплением требует рабочей кодовой среды. Если среда настроена неправильно, модель тратит токены на исправление ошибок, и ничего не учится; в крайних случаях среда полностью не запускается, и вся вычислительная мощность тратается впустую. autoinstall решает эту проблему в два шага: первый — агент читает документацию и конфигурацию кодовой базы, предлагая 10 команд для проверки и ожидаемый вывод; второй — другой агент берет 3 из этих команд и настраивает среду с нуля до тех пор, пока команда не выполнится. Второй шаг最多 5 раз повторяется, при полном провале среда отбрасывается.

Во время настройки среды агент активно дополняет недостающие зависимости: подделывает таблицы базы данных, создает конфигурацию MinIO вместо S3, запускает контейнер Docker в качестве sidecar-сервиса, а также генерирует заглушки изображений. В статье на примере блокчейн-проекта celo-org/celo-monorepo показан весь процесс: после неудачной первой попытки агент во второй создает моковых пользователей, обходя аутентификацию, и в итоге тест проходит.

Composer 2 набрал 61,7% в Terminal-Bench (бенчмарк, оценивающий способность модели создавать и развивать среду), что на 14 процентных пунктов выше, чем 47,9% у Composer 1.5. Cursor заявил, что в будущем планируется привлечь более старую версию Composer к участию в дополнительных этапах обучения, включая предварительную обработку данных, управление запуском и оптимизацию архитектуры.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

ЕС запрещает порно с дипфейками, сгенерированными с помощью ИИ, 7 мая

Новости индустрии ИИ

Согласно Xinhua News Agency, 7 мая депутаты Европарламента и представители стран ЕС достигли консенсуса о запрете системам искусственного интеллекта генерировать порнографический контент с использованием дипфейков. Запрет будет включён в поправки к Закону об искусственном интеллекте 2024 года. Европейский парламент

GateNews9м назад

Tether выпустила медицинскую AI-модель QVAC MedPsy и набрала 62,62 балла в версии с 17 млрд параметров

USDT news Прогресс проекта Новости индустрии ИИ Инструменты и приложения ИИ

По данным Odaily, Tether AI Research Group выпустила QVAC MedPsy — медицинскую AI-модель, предназначенную для работы локально на смартфонах и носимых устройствах без зависимости от облака. Версия с 1,7 миллиарда параметров набрала 62,62 балла по семи медицинским бенчмаркам, обойдя MedGemma-1.5-4B от Google на 11,42 poi

GateNews29м назад

Запуск B.AI API: представлены четыре новых модели, включая GPT-5.5 Instant, в течение 48 часов после релиза OpenAI

Новости индустрии ИИ

API B.AI запустил четыре новые модели: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 и GLM-5.1. GPT-5.5 Instant завершила базовую адаптацию и интеграцию интерфейса в течение 48 часов после релиза OpenAI, обеспечив мгновенный доступ без задержек к

GateNews34м назад

Модель медицинского ИИ от Tether на 1,7 млрд превосходит сегодня конкурента в 16 раз большего размера

USDT news Прогресс проекта Новости индустрии ИИ

По данным исследовательской команды Tether по ИИ, сегодня компания запустила серии медицинских языковых моделей QVAC MedPsy, предназначенные для локального развертывания на смартфонах и носимых устройствах без облачной зависимости. Версия с 1,7 млрд параметров набрала 62,62 по семи медицинским бенчмаркам, превзойдя Google MedGemma-4B

GateNews45м назад

Оценка Anthropic перед IPO достигла 1,2 триллиона долларов, превысив оценку OpenAI на 20%

Рынки прогнозирования Рейтинги и таблицы лидеров Новости индустрии ИИ

По данным Odaily, неявная оценка Anthropic на блокчейн-рынке пред-IPO достигла 1,2 триллиона долларов, превысив OpenAI примерно на 20%. Если компания выйдет на биржу при такой оценке, она займет 11-е место среди крупнейших публично торгуемых компаний в мире по рыночной капитализации, уступая Apple,

GateNews49м назад

Фондовое ралли в Южной Корее обгоняет глобальные рынки на фоне бумa ИИ

Акции Индексы Новости индустрии ИИ

Фондовый рынок Южной Кореи переживает беспрецедентный рост, который обеспечивают акции полупроводников, связанные с искусственным интеллектом: индекс KOSPI прибавил 78% с начала этого года, обогнав по темпам любые другие крупные рынки в мире, говорится в данных Financial Modeling Prep, на которые ссылается Axios в своем анализе. AI

CryptoFrontier58м назад

комментарий

0/400

Нет комментариев