Согласно раскрытиям для отношений с инвесторами от 12 мая, разрабатываемый инференс-чип Yuntianliyifei использует архитектуру GPNPU в качестве основной технологической дорожной карты. Ключевые технические моменты включают универсальную программируемость на уровне GPGPU, совместимую с распространённой экосистемой CUDA, оптимизированные NPU-ядра для повышения эффективности инференса, а также 3D-стековую архитектуру памяти, предназначенную для увеличения пропускной способности и снижения задержек доступа, что позволяет прорваться через узкое место «стена памяти».
Компания также применяет модульную архитектуру вычислений, чтобы поддерживать масштабирование до уровня стоек при строительстве супернод для инференса MoE-моделей масштаба триллион и сотни триллионов. Технологическая дорожная карта нацелена на экспоненциальное снижение стоимости токенов и ускорение развёртывания приложений больших моделей.
Related News
OpenAI запустила программу кибербезопасности Daybreak; трёхуровневая архитектура GPT-5.5 против Anthropic Mythos
NVIDIA объявила о создании долгосрочного стратегического сотрудничества с IREN, планируя развернуть 5 ГВт инфраструктуры для ИИ
Сделка IREN с Nvidia сигнализирует о повороте в сторону ИИ на $3,4 млрд