技術(shù)
導(dǎo)讀:“稚暉君”創(chuàng)業(yè)項(xiàng)目智元機(jī)器人發(fā)布了首個(gè)通用具身基座模型 —— 智元啟元大模型(Genie Operator-1)。
3 月 10 日消息,“稚暉君”創(chuàng)業(yè)項(xiàng)目智元機(jī)器人發(fā)布了首個(gè)通用具身基座模型 —— 智元啟元大模型(Genie Operator-1),它開創(chuàng)性地提出了Vision-Language-Latent-Action(ViLLA)架構(gòu),該架構(gòu)由 VLM(多模態(tài)大模型)+ MoE(混合專家)組成,實(shí)現(xiàn)了可以利用人類視頻學(xué)習(xí),完成小樣本快速泛化,降低了具身智能門檻,并成功部署到智元多款機(jī)器人本體。
智元機(jī)器人還預(yù)告了下一代具身智能機(jī)器人產(chǎn)品,不過沒有透露推出時(shí)間。