DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости

Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode полностью поддерживают модели серии DeepSeek V4 благодаря тесному сотрудничеству между технологиями чипа и модели.

Ascend 950 обеспечивает развертывание инференса моделей DeepSeek V4 с высокой пропускной способностью и низкой задержкой за счет методов склеивания ядер и параллелизма в несколько потоков, чтобы снизить накладные расходы на вычисления Attention и обращения к памяти. Для DeepSeek V4-Pro с входом 8K Ascend 950 достигает примерно 20ms TPOT при 4,700 TPS на одно устройство в режиме Decode; для DeepSeek V4-Flash при входе до 8K он достигает примерно 10ms TPOT при пропускной способности 1,600 TPS. Серия Ascend A3 supernode также обеспечивает полную совместимость: предоставлены эталонные реализации для быстрого дообучения. На основе supernode Ascend A3 из 64 карт с большим режимом EP DeepSeek V4-Flash достигает более 2,000 TPS на одну карту в режиме Decode в сценариях вход-выход 8K/1K, используя движок инференса vLLM. Полные линейки продуктов Huawei Ascend A2, A3 и 950 поддерживают как DeepSeek V4-Flash, так и V4-Pro.

Huawei Cloud объявила о совместимости с DeepSeek V4 для самых первых, предоставив разработчикам сервисы API token в один клик через свою платформу MaaS. Huawei Cloud оптимизировала возможности системного уровня, уровня операторов и уровня кластера, чтобы обеспечить быструю адаптацию моделей и высокопроизводительное развертывание. Компании, включая Kingsoft WPS и 360, уже интегрировали новую модель DeepSeek через Huawei Cloud.

Cambricon также объявила о совместимости Day 0 с DeepSeek V4-Flash и V4-Pro на основе фреймворка инференса vLLM, а код адаптации был с открытым исходным кодом опубликован для сообщества GitHub. Ранее Cambricon уже достигла совместимости для самых первых при выпуске DeepSeek V3.2 в прошлом году: она провела глубокую оптимизацию совместной производительности ПО и оборудования на моделях серии DeepSeek.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Cursor нанимает бывшего руководителя Palo Alto Networks Саймона Грина, чтобы возглавить расширение в Азии

Согласно Cursor AI, компания в сфере ИИ-разработки создала региональную штаб-квартиру в Сингапуре и назначила Симона Грина, бывшего старшего руководителя Palo Alto Networks, региональным президентом. Грин провёл более 10 лет в Palo Alto Networks, где помогал нарастить присутствие компании в Японии и Азии P

GateNews15м назад

Основатель Pi Network выступил на Consensus 2026 с докладом о верификации личности в эпоху ИИ

Согласно объявлению официального аккаунта Pi Network в X, сооснователь Pi Network Чэндиао Фань (Chengdiao Fan) выступил 6 мая на конференции Consensus 2026 в Майами (США) с докладом на тему «практическая интеграция Web3, AI и блокчейна», а Кокарис — 7 мая принял участие в дискуссии с названием «как доказать, что вы человек, в мире AI».

MarketWhisper32м назад

Apple согласилась выплатить 250 млн долларов в рамках коллективного мирового соглашения по иску, связанному с Apple Intelligence

По сообщению BBC от 6 мая, компания Apple 5 мая подала в федеральный суд в Калифорнии предложенное соглашение о мировом урегулировании, согласившись выплатить 250 млн долларов (около 184 млн фунтов стерлингов) для урегулирования коллективного иска, в котором утверждается, что она вводила в заблуждение рекламой относительно функций Apple Intelligence и Siri на базе ИИ; Apple в соглашении отрицает любые неправомерные действия, и соглашение подлежит одобрению судьей.

MarketWhisper46м назад

Предпросмотр Tencent Hunyuan Hy3 показывает рост токенов в 10 раз за две недели

С момента запуска две недели назад предварительная версия Hy3 от Tencent Hunyuan показала 10-кратный рост числа обращений к токенам по сравнению с предыдущей моделью Hy2. Особенно резко увеличилось использование токенов в сценариях с кодом и агентами; об этом сообщают приложения WorkBuddy, Codebuddy и Qclaw, указавшие на рост

GateNews55м назад

Маск рассматривал идею объединить OpenAI с Tesla в конце 2017 года, суд заслушал показания

Согласно показаниям на федеральном суде в Окленде, Калифорния, Илон Маск в конце 2017 года и в начале 2018 года рассматривал вариант объединить OpenAI с Tesla — об этом заявила Шивон Зилис, руководитель Neuralink и бывший член совета директоров OpenAI. Зилис показала, что Маск изучал возможность предложить Сэму Альтману место в совете директоров Tesla

GateNews1ч назад
комментарий
0/400
Нет комментариев