DeepSeek и Пекинский университет опубликовали статью DSpark 27 июня, основатель Лян Вэньфэн указан как автор.

Согласно Guru Club, 27 июня команда DeepSeek и Пекинский университет опубликовали исследовательскую работу под названием «DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation». В работе представлен модуль спекулятивного декодирования для оптимизации производительности инференса на существующих моделях DeepSeek-V4-Pro и DeepSeek-V4-Flash. Одновременно команда открыла исходный код DeepSpec — полноценного стека для обучения и оценки моделей-черновиков спекулятивного декодирования под лицензией MIT. DeepSpec в настоящее время поддерживает три реализации: DSpark, DFlash и Eagle3. Примечательно, что основатель DeepSeek Лян Вэньфэн указан как автор работы.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
ManeyToFuturevip
· 1ч назад
Погнали 🔥
Посмотреть ОригиналОтветить0