返回资讯列表
📰 资讯2026年5月3日

中国科学院发布类脑大模型瞬悉2.0:4M序列推理加速10倍,训练成本降至1/10

中科院自动化所推出类脑脉冲大模型瞬悉2.0,长序列推理加速10倍,仅32卡A100即可完成训练转换

来源:新智元/新浪财经 · 查看原文 →

中国科学院自动化研究所李国齐、徐波团队发布类脑大模型「瞬悉2.0」(SpikingBrain2.0-5B),在架构、训练算法和应用广度上全面升级。该模型仅需32张A100显卡、9天即可完成对Qwen3系列模型的持续预训练转换,训练成本较瞬悉1.0降低10倍以上(CPT数据量从150B降至14B)。在4M序列长度下,首Token生成速度达Qwen3的10.13倍;FP8量化路径下提速达15.13倍,精度损失仅0.24%。8卡A100即可支持10M序列推理,而Qwen3基线在4M时已超出显存。性能方面,瞬悉2.0语言模型在MMLU、GSM8K、HumanEval等基准上比肩Qwen3,视觉语言模型实现多模态能力突破。团队已开源语言模型与视觉语言模型,论文及代码同步发布。

发布于 2026年5月3日 · 更新于 2026年5月3日