據智元機器人官微,3月10日,智元發(fā)布首個通用具身基座模型——智元啟元大模型(Genie Operator-1),提出了Vision-Language-Latent-Action(ViLLA)架構,該架構由VLM(多模態(tài)大模型)+ MoE(混合專家)組成。