据 Beating 称,华为、清华大学科学技术大学(USTC)和北京大学的研究人员发布了 HyperParallel-MoE,这是一种面向 Ascend A3 芯片的编译器调度框架。该框架通过 36% 降低 MoE 专家计算模块的延迟,并在 256 节点集群中运行 671B 参数的 DeepSeek 风格模型时,实现整体数据处理速度提升 58%(快 1.49–1.58 倍);同时,单步训练速度提升 8–9%。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见
声明。