返回资讯列表
📰 新闻2026年4月28日

小米开源VLA大模型Xiaomi-Robotics-0:亚毫米级双臂操作

小米开源4.7B参数VLA模型Xiaomi-Robotics-0,在LIBERO基准测试中达98.7%成功率,实现亚毫米级机器人操作。

来源:小米Robotics官方 / AIbase · 查看原文 →

小米正式开源VLA视觉语言动作大模型Xiaomi-Robotics-0的后训练全流程,包括技术报告、模型权重和源代码。该模型基于Qwen3-VL-4B-Instruct预训练VLM与扩散Transformer架构,共47亿参数。在三大仿真基准测试中表现卓越:LIBERO平均成功率达98.7%,SimplerEnv在视觉匹配、视觉聚合和WidowX三个子任务中分别取得85.5%、74.7%和79.2%的成绩,CALVIN任务中平均序列长度达4.75和4.80。在真实机器人评估中,该模型在乐高拆卸和毛巾折叠两项高难度双臂操作任务中实现了高成功率和强吞吐量,展现出亚毫米级精细操作能力。训练数据集包含约2亿步机器人轨迹和超8000万条视觉语言数据,开源策略有效降低了高性能机器人开发门槛,推动具身智能开发者生态建设。

发布于 2026年4月28日 · 更新于 2026年4月28日