📰 资讯2026年5月3日

中国科学院发布类脑大模型瞬悉2.0：4M序列推理加速10倍，训练成本降至1/10

中科院自动化所推出类脑脉冲大模型瞬悉2.0，长序列推理加速10倍，仅32卡A100即可完成训练转换

来源：新智元/新浪财经 · 查看原文 →

中国科学院自动化研究所李国齐、徐波团队发布类脑大模型「瞬悉2.0」（SpikingBrain2.0-5B），在架构、训练算法和应用广度上全面升级。该模型仅需32张A100显卡、9天即可完成对Qwen3系列模型的持续预训练转换，训练成本较瞬悉1.0降低10倍以上（CPT数据量从150B降至14B）。在4M序列长度下，首Token生成速度达Qwen3的10.13倍；FP8量化路径下提速达15.13倍，精度损失仅0.24%。8卡A100即可支持10M序列推理，而Qwen3基线在4M时已超出显存。性能方面，瞬悉2.0语言模型在MMLU、GSM8K、HumanEval等基准上比肩Qwen3，视觉语言模型实现多模态能力突破。团队已开源语言模型与视觉语言模型，论文及代码同步发布。

发布于 2026年5月3日 · 更新于 2026年5月3日