Сообщается, что команда SpaceX внутри компании почти завершила разработанный ею собственный AI-фреймворк на языке C для обучения больших моделей V1.0. Фреймворк оптимизирован под гигантский вычислительный кластер, состоящий из 220 000 ускорителей Nvidia GB300 и интерфейсов сети 800G. Созданный с упором на эффективность на «голом железе» и глубокий конвейерный параллелизм, C-язычный архитектурный подход, как утверждается, обеспечивает более чем в 10 раз более высокую производительность по сравнению с массовым фреймворком JAX от Google.
Новый стек обучения будет работать на суперкомпьютерном кластере SpaceX Colossus, чтобы поддержать полномасштабное обучение и итерации следующей версии модели Grok v5.