Codex превосходит DRL в управлении потоками с рукописным кодом: общая стоимость $14

По данным Beating, исследователь по пост-тренингу в OpenAI Пол Гарнье продемонстрировал, что Codex 5.5 способен генерировать интерпретируемый код управления, превосходя базовые подходы deep reinforcement learning в задачах гидродинамики. Вместо обучения нейросетей Гарнье использовал модель, чтобы итеративно дорабатывать Python-скрипты, анализируя физические симуляции, и добился более высокой эффективности чем в половине протестированных сценариев.

Сгенерированные ИИ правила управления были физически интерпретируемыми, например: «задерживать впрыск струи, когда локальная кривизна превышает порог». В отличие от «черных ящиков» нейросетей кодовый подход оказался устойчивым при сдвигах распределений; когда длительность тестов была увеличена в четыре раза, традиционные модели DRL разрушились, тогда как физически-информированный код сохранил стабильность. Внедрение полной стратегии управления потребовало 21,25 миллиона токенов, что в сумме составило менее $14.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев