📰 新闻2026年4月26日
寒武纪宣布DeepSeek-V4全系列Day0适配,优化代码开源
寒武纪完成DeepSeek-V4全系列模型发布当天的硬件适配,覆盖Flash和Pro两个版本,适配代码已开源。
来源:AIbase · 查看原文 →
寒武纪宣布已完成基于vLLM推理框架的DeepSeek-V4全系列模型Day0适配,包括285B参数的Flash版本和1.6T参数的Pro版本。针对DeepSeek-V4独特的稀疏注意力和压缩结构,寒武纪利用自研向量融合算子库Torch-MLU-Ops对Compressor等核心模块进行专项加速,使用BangC高性能编程语言编写了稀疏Attention和GroupGemm等热点算子优化内核,全面支持五维混合并行策略(TP/PP/SP/DP/EP)、低精度量化和PD分离部署。硬件层面深度利用MLU的内存访问和排序加速特性,有效应对DeepSeek-V4复杂的索引结构。适配代码已开源至GitHub社区。行业分析认为,这标志着国产AI产业链在软硬件协同方面已进入成熟阶段。
发布于 2026年4月26日 · 更新于 2026年4月26日