Nous Research открыла исходный код Lighthouse Attention с ускорением в 17 раз на B200 для контекста 512K

2026-05-16 15:14:17

Beating сообщает, что Nous Research открыла исходный код Lighthouse Attention — механизма обучения для длинного контекста, который обеспечивает 17-кратное ускорение при обработке текста длиной 512 тыс. на одном GPU B200, а также 1,4–1,7-кратное ускорение обучения end-to-end при длине 98 тыс. В основе подхода лежит схема coarse-to-fine: сначала он сканирует сжатые сводки на разных уровнях, чтобы определить ключевые сегменты, затем передаёт отфильтрованный текст в FlashAttention для обработки. В тестах на модели с 512k параметров, обученной на 50 миллиардах токенов, метод не только сократил время обучения, но и соответствовал базовой производительности обучения с полностью attention-механизмом или превзошёл её.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-16 13:14

OpenAI устраняет два сбоя, которые вызывали ухудшение работы GPT-5.5 Codex, и сбрасывает лимиты использования для пользователей

05-16 09:40

Илон Маск утверждает, что Grok V9 (1,5 триллиона параметров) демонстрирует огромный скачок производительности по сравнению с V8 16 мая

05-15 15:01

Grok V9 от Илона Маска завершил обучение с 1,5 триллионами параметров и демонстрирует значительный скачок производительности по сравнению с V8

05-15 07:00

Поиск чипов Nvidia H200 вырос в 25 раз на JD.com с 14 мая

05-15 06:45

Claude Opus побил рекорд nanoGPT: 2 930 шагов, при этом было использовано 14 000 часов работы GPU H200

Детальный анализ