2025年智源大會上,人形機器人成為焦點。智源研究院院長王仲遠表示,人工智能正加速從數(shù)字世界走向物理世界,致力于解決實際生產(chǎn)生活問題。
王仲遠認為,大語言模型性能提升逐漸遇到瓶頸,未來發(fā)展方向?qū)膯我坏拇笳Z言模型轉(zhuǎn)向多模態(tài)尤其是原生多模態(tài)世界模型。這些模型能夠感知和理解物理世界,從而推動與物理世界的交互。
在技術(shù)路線方面,智源研究院推出“悟界”系列大模型,包括原生多模態(tài)世界模型Emu3、腦科學(xué)多模態(tài)通用基礎(chǔ)模型見微Brainμ、跨本體具身大小腦協(xié)作框架RoboOS 2.0與具身大腦RoboBrain 2.0以及全原子微觀生命模型OpenComplex2。
關(guān)于“世界模型”的核心定義,王仲遠以咖啡杯為例指出,現(xiàn)有模型僅能描述靜態(tài)信息,而無法預(yù)測動態(tài)變化。Emu3的核心突破在于建立對物理因果關(guān)系的理解,而非簡單拼接多模態(tài)信息。
對于具身智能的落地路徑,王仲遠持務(wù)實態(tài)度。他肯定了人形機器人的長期價值,但短期內(nèi)四足、輪式等形態(tài)將共存。人形機器人成熟周期較長,現(xiàn)階段穩(wěn)定性仍需提升。
針對數(shù)據(jù)悖論問題,王仲遠提出通過互聯(lián)網(wǎng)視頻數(shù)據(jù)訓(xùn)練基礎(chǔ)能力,再以少量真實數(shù)據(jù)強化學(xué)習(xí)微調(diào)的方法。工廠場景因其封閉性和重復(fù)任務(wù)特點,成為具身智能首個突破口。
關(guān)于“大小腦融合”概念,王仲遠表示,當前數(shù)據(jù)量不足以支持該模型訓(xùn)練,未來5-10年可能實現(xiàn)。具身智能目前泛化性不足,需逐步發(fā)展到具備跨領(lǐng)域泛化能力。
MCP、Agent成為人工智能領(lǐng)域熱點話題。王仲遠認為,當基礎(chǔ)大模型達到可用狀態(tài)后,Agent可成為產(chǎn)業(yè)界發(fā)力方向,類似于移動互聯(lián)網(wǎng)APP的發(fā)展趨勢。
王仲遠指出,“百模大戰(zhàn)”已收斂至少數(shù)玩家,未來可能出現(xiàn)基于基礎(chǔ)大模型衍生出的垂類模型競爭。具身大模型發(fā)展仍處于早期階段,面臨技術(shù)路線分歧和產(chǎn)業(yè)落地挑戰(zhàn)。
王仲遠總結(jié),當機器人能夠真正理解物理世界的因果關(guān)系時,將是物理AGI的重要里程碑。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...