По данным мониторинга Beating, Cursor опубликовал один из тренировочных трюков серии моделей Composer: использование предыдущего поколения модели для автоматической сборки рабочей среды для следующего поколения с помощью обучения с подкреплением (RL). При обучении Composer 2 Cursor использовал Composer 1.5 для выполнения этой задачи, называя это autoinstall.
Обучение с подкреплением требует рабочей кодовой среды. Если среда настроена неправильно, модель тратит токены на исправление ошибок, и ничего не учится; в крайних случаях среда полностью не запускается, и вся вычислительная мощность тратается впустую. autoinstall решает эту проблему в два шага: первый — агент читает документацию и конфигурацию кодовой базы, предлагая 10 команд для проверки и ожидаемый вывод; второй — другой агент берет 3 из этих команд и настраивает среду с нуля до тех пор, пока команда не выполнится. Второй шаг最多 5 раз повторяется, при полном провале среда отбрасывается.
Во время настройки среды агент активно дополняет недостающие зависимости: подделывает таблицы базы данных, создает конфигурацию MinIO вместо S3, запускает контейнер Docker в качестве sidecar-сервиса, а также генерирует заглушки изображений. В статье на примере блокчейн-проекта celo-org/celo-monorepo показан весь процесс: после неудачной первой попытки агент во второй создает моковых пользователей, обходя аутентификацию, и в итоге тест проходит.
Composer 2 набрал 61,7% в Terminal-Bench (бенчмарк, оценивающий способность модели создавать и развивать среду), что на 14 процентных пунктов выше, чем 47,9% у Composer 1.5. Cursor заявил, что в будущем планируется привлечь более старую версию Composer к участию в дополнительных этапах обучения, включая предварительную обработку данных, управление запуском и оптимизацию архитектуры.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
ЕС запрещает порно с дипфейками, сгенерированными с помощью ИИ, 7 мая
Согласно Xinhua News Agency, 7 мая депутаты Европарламента и представители стран ЕС достигли консенсуса о запрете системам искусственного интеллекта генерировать порнографический контент с использованием дипфейков. Запрет будет включён в поправки к Закону об искусственном интеллекте 2024 года. Европейский парламент
GateNews9м назад
Tether выпустила медицинскую AI-модель QVAC MedPsy и набрала 62,62 балла в версии с 17 млрд параметров
По данным Odaily, Tether AI Research Group выпустила QVAC MedPsy — медицинскую AI-модель, предназначенную для работы локально на смартфонах и носимых устройствах без зависимости от облака. Версия с 1,7 миллиарда параметров набрала 62,62 балла по семи медицинским бенчмаркам, обойдя MedGemma-1.5-4B от Google на 11,42 poi
GateNews29м назад
Запуск B.AI API: представлены четыре новых модели, включая GPT-5.5 Instant, в течение 48 часов после релиза OpenAI
API B.AI запустил четыре новые модели: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 и GLM-5.1. GPT-5.5 Instant завершила базовую адаптацию и интеграцию интерфейса в течение 48 часов после релиза OpenAI, обеспечив мгновенный доступ без задержек к
GateNews34м назад
Модель медицинского ИИ от Tether на 1,7 млрд превосходит сегодня конкурента в 16 раз большего размера
По данным исследовательской команды Tether по ИИ, сегодня компания запустила серии медицинских языковых моделей QVAC MedPsy, предназначенные для локального развертывания на смартфонах и носимых устройствах без облачной зависимости. Версия с 1,7 млрд параметров набрала 62,62 по семи медицинским бенчмаркам, превзойдя Google MedGemma-4B
GateNews45м назад
Оценка Anthropic перед IPO достигла 1,2 триллиона долларов, превысив оценку OpenAI на 20%
По данным Odaily, неявная оценка Anthropic на блокчейн-рынке пред-IPO достигла 1,2 триллиона долларов, превысив OpenAI примерно на 20%. Если компания выйдет на биржу при такой оценке, она займет 11-е место среди крупнейших публично торгуемых компаний в мире по рыночной капитализации, уступая Apple,
GateNews49м назад
Фондовое ралли в Южной Корее обгоняет глобальные рынки на фоне бумa ИИ
Фондовый рынок Южной Кореи переживает беспрецедентный рост, который обеспечивают акции полупроводников, связанные с искусственным интеллектом: индекс KOSPI прибавил 78% с начала этого года, обогнав по темпам любые другие крупные рынки в мире, говорится в данных Financial Modeling Prep, на которые ссылается Axios в своем анализе.
AI
CryptoFrontier58м назад