11月19日,2025中國具身智能機器人大會在深圳舉行。
以人形機器人為代表的具身智能正成為新一輪科技與產業競賽的焦點,從工業、商業場景到家庭生活,通用機器人被寄予“下一代超級生產力”的厚望,但數據匱乏、算力瓶頸與工程化落地難題,同樣給行業帶來了前所未有的挑戰。
為此,由智猩猩、智東西共同發起主辦,機器人前瞻、極果協辦的首屆具身智能大會,聚焦于具身智能前沿技術與產業應用,設置了主論壇、高端對話、專題論壇、圓桌對話等多個環節;分會場為閉門制,組織了具身世界模型技術研討會、機器人模仿學習與強化學習研討會以及具身VLA大模型技術研討會。
來自清華大學、浙江大學、北京通用人工智能研究院,以及優必選、云天勵飛、諾亦騰機器人、藍馳創投等產學研資代表,暢談人形機器人邁向通用智能的核心挑戰與具身智能規?;涞氐淖钚掠^察與思考,覆蓋模型自主化、本體創新、數據互通、算力支撐、場景落地、中美產業競爭等前沿議題。
大會吸引了超千人參與,在展覽區,Alluxio、寬恒科技、松靈機器人、極狐Gitlab、大象機器人、星際光年、信步科技、靈心巧手、星塵智能等展商進行展示。
▲展區
作為主辦方代表,智一科技聯合創始人、CEO龔倫常發表致辭。他回顧了團隊深耕機器人領域十年的歷程,從2015年起持續報道機器人與具身智能,見證了中國機器人產業的關鍵節點。他談道,本次大會是智一科技十年持續投入的延續,未來將把具身智能機器人大會打造為大灣區具有影響力的產業峰會。
▲智一科技聯合創始人、CEO龔倫常
接下來,我們將圍繞主論壇、高端對話、專題論壇與圓桌對話,呈現14位嘉賓的精彩觀點與思考。
一、主論壇:從模型、本體到數據,人形機器人邁向通用智能的三道關
人形機器人已成為具身智能落地的核心載體,行業正迎來技術突破與規?;涞氐年P鍵期。在多位學者和產業人士看來,人形機器人仍被“模型、本體、數據”三道難關卡住,數據匱乏與泛化性不足成為主要瓶頸。行業正在大力推動數據集互通、全棧技術整合,加速工業場景批量化應用與家庭場景滲透。資本層面也已錨定萬億級市場空間,具身智能正從技術探索邁向產業價值釋放新階段。
1、浙大熊蓉:人形機器人面臨三挑戰,模型不能僅依賴VLM
浙江大學求是特聘教授、浙江人形機器人創新中心首席科學家熊蓉教授認為,具身智能人形機器人代表著通用作業形態與行為智能,前景廣闊,但產業仍面臨模型、本體與數據三大挑戰。
數據方面,當前仿真生成、遙操采集和真人動捕等方式均存在局限。她強調,需建立高精準時空模型與高保真物理交互模擬,以實現低成本、高質量的數據生成。
模型層面,熊蓉認為不能僅依賴VLM(視覺語言模型)的發展,必須確保在VLM失效時任務仍可收斂。本體方面,需在提升自由度的同時優化負載自重比,兼顧性能與成本。
目前,她領銜的浙江人形機器人創新中心已開發出可泛化高精度控制小腦與長序列規劃任務大腦,相關技術應用于3C、紡織、汽車等領域,部分場景準確率達99.99%,即將進入批量化應用階段。
▲浙江大學求是特聘教授、浙江人形機器人創新中心首席科學家熊蓉
2、星塵智能王佳楠:繩驅路線破局具身智能三位一體,量產周期領先海外頭部
星塵智能副總裁、前DeepMind研究員王佳楠認為,AGI(通用人工智能)應誕生并服務于真實世界的物理交互。為實現這一目標,星塵智能基于“繩驅本體-領先遙操/數據-高效模型”三位一體的全棧平臺分三步走:
第一步,星塵智能成功量產繩驅AI機器人Astribot S1,為世界首家,比同路線美國公司1X領先至少一個周期。其獨特繩驅傳動,讓機器人模仿人的肌腱絲滑運動和力控方式,具備輕量化結構下的高動態操作、高擬人表現、高交互安全,從而勝任復雜靈巧操作和與人交互協作。
第二步即商業化,星塵智能借鑒自動駕駛L2到L4的路線,推出“AI模型自主+遠程遙控兜底”的混合解決方案,提升任務成功率,已在B端獲得千臺級訂單。
最后,星塵智能的終極目標是推動機器人走進家庭場景,讓每個人都擁有專屬的AI機器人助理。
▲星塵智能副總裁、前DeepMind研究員王佳楠
3、國創中心江磊:具身智能落地瓶頸是數據,全國訓練場數據集需互通
國地共建人形機器人創新中心首席科學家江磊認為,人形機器人迎來了關鍵時刻,隨著智能機器人發展到具身智能機器人,開發范式也由基于模型發展變成了基于數據。
開源推動了人形機器人技術的快速發展,并形成了軟硬件一體化的趨勢,機器人開發流程演變為包括機器人硬件平臺、機器人訓練場、再到機器人數據集和機器人數據模型的全過程。
如何讓具身智能機器人發展進入落地運動的泛化階段?目前瓶頸仍是數據,江磊希望全國的訓練場數據集能夠互聯互通,讓數據得以快速增長。
人形機器人是推動具身智能向前發展的主要力量,其熱度至少會持續到2035年,江磊稱,他們正在做訓練場的2.0版本,將訓練場視為關鍵技術,把具身智能、強化學習和世界模型融匯貫通。
▲國地共建人形機器人創新中心首席科學家江磊
4、BIGAI黃思遠:人形機器人交互泛化性不足,全身遙操系統解決數據挑戰
北京通用人工智能研究院(BIGAI)研究科學家、具身機器人中心主任黃思遠觀察到,隨著硬件、模型的成熟和應用潛力的展現,人形機器人迎來一波新的發展。
從能力維度看,通用人形機器人需具備物理交互與社會交互能力,而當前系統在泛化性上仍存不足。若要真正走入家庭并服務現實世界,機器人必須攻克靈巧操作、全身協同操作及人機協作等核心能力瓶頸。
北京通用人工智能研究院已經打造了全身遙操系統CLONED,以解決高質量全身數據缺乏的挑戰。該院還打造了統一的力位混合控制框架UniFP,幫助機器人實現柔順控制,研究論文獲得今年CoRL的最佳論文獎。
黃思遠認為,未來機器人還需在基于視覺的自主移動、力覺/觸覺感知等領域實現突破,這需要業界的長期投入。
▲北京通用人工智能研究院(BIGAI)研究科學家、具身機器人中心主任黃思遠
5、靈心巧手蘇洋:靈巧手需要提高“泛化性”,數據是最缺乏的資源
靈心巧手聯合創始人、首席AI架構師蘇洋認為,想要機器人具備通用性,“手”首先要具有泛化性。靈心巧手Linker Hands具備7-42個自由度,是唯一可360°旋轉的靈巧手。高自由度靈巧手L20價格僅為Shadow Hands的1/10至1/20,而特斯拉Optimus五指靈巧手則不對外銷售。L6等靈巧手具備百萬次壽命,O6則價格低至0.66萬。
該產品已在工業場景實現打螺絲、點膠等操作,還能演奏多種樂器,亮相世界機器人運動會開閉幕式。此外,靈心巧手即將發布Dex-Serl項目,操作精度達亞毫米級、成功率100%。
數據采集上,蘇洋認為,數據是訓練中最缺乏的資源。靈心巧手實現通過一人操控數十臺機器,整體數據采集速率得到大幅度提升。此外,靈心巧手還提出“具身運算”新計算單位EOPS,衡量具身智能靈巧操作能力。
▲靈心巧手聯合創始人、首席AI架構師蘇洋
6、藍馳創投曹?。耗P屯顿Y看四大核心能力,具身智能正解鎖萬億市場
藍馳創投合伙人曹巍談到,具身智能解決的是人類對無限生產力的渴望,從市場需求、長期宏觀支持、人才供給與生態系統、產業集群等方面來看,中國人形機器人產業具有長期競爭優勢。
具身智能和人形機器人是技術導向型的創新產業,我們需要關注技術變化帶來的產業動態與在不同場景的落地節奏,以及機器人的智能力,如導航與交互、運動智能、作業智能等。曹巍還特別提到了看好特種機器人,稱其有點被市場忽視。
藍馳的模型投資策略瞄準四大核心要素能力:采集與處理數據、模型架構創新、強化學習和場景數據采集與微調。曹巍稱,通用機器人及人形機器人的市場規模巨大,目前正在逐漸解鎖從幾個億到上萬億的市場空間。
▲藍馳創投合伙人曹巍
二、高端對話:上半場走跑跳,下半場精細化,“DeepSeek時刻”或在10年后
以“具身智能機器人的‘DeepSeek時刻’還有多遠”為主題的高端對話,由智一科技聯合創始人、智車芯產媒矩陣總編輯張國仁主持,北京通用人工智能研究院研究科學家、具身機器人中心主任黃思遠,清華大學自動化系長聘副教授、靈御智能創始人兼首席科學家莫一林,國地共建人形機器人創新中心首席科學家江磊,靈心巧手聯合創始人、首席AI架構師蘇洋,藍馳創投合伙人曹巍五位嘉賓進行分享。
張國仁以近期熱議的“人們對小鵬人形機器人真假爭論”引出討論,并與幾位嘉賓圍繞類似“DeepSeek時刻”的拐點何時到來、技術鏈條如何成熟、市場預期是否過熱以及人機共存的未來等問題,展開了精彩激烈的討論。
▲智一科技聯合創始人、智車芯產媒矩陣總編輯張國仁
1、黃思遠:DeepSeek式反超不會重演,機器人還要拼全身協調和靈巧操作
黃思遠判斷,有關“小鵬人形機器人”的爭論,本質來自步態、自由度和硬件擬人程度已接近極限,人們第一次真正感受到人形機器人的真實進展。但在他看來,“擬人”并不是機器人發展的終點。
在拐點話題的討論中,黃思遠的判斷很有指向性。他認為“DeepSeek式反超不會在機器人領域重演”,原因非常明確:在硬件與運動控制維度,中國本來就已領先,并不存在大模型那樣“從落后到反超”的空間。而機器人真正的能力在于“靈巧操作與全身協調能力的突破”。這樣的能力才會真正改變大眾認知,也才是機器人跨向真實世界的決定性能力。
對于“人機共存”的未來,他提醒,人類適應新技術的速度遠比行業想象快,真正需要提前設計的是機器人的“安全邊界、倫理機制與功能底線”。
▲北京通用人工智能研究院研究科學家、具身機器人中心主任黃思遠
2、莫一林:機器人短期不會“完全體”,真正落地的是“半自動形態”
隨著行業在“擬人化”方向開始展示新進展,莫一林提醒,行業也必須重新權衡“擬人”與“實用”之間的關系。很多結構是為“更像人”而設計的,但真正投入產線后,耐久度、安全性、負載能力往往遠比形態更關鍵。
而談到未來的人機共存形態時,莫一林認為,未來十年我們在現實世界里遇到的機器人,更多會是“半自動+人類遠程操作”的混合體,類似自動駕駛背后的安全員機制,人機共存不會突然到來。
▲靈御智能創始人兼首席科學家莫一林
3、江磊:機器人也有“ChatGPT時刻”和“DeepSeek時刻”
在談到“小鵬機器人”帶來的討論熱度時,江磊認為,這種關注本身就是中國在人形機器人“走、跑、跳”等身體能力方面已具備優勢的一個例證。而當機器人能持續完成工業與生活場景中的任務,那個時候將更為驚艷。
也因此,在判斷行業拐點時,江磊把機器人發展的關鍵節點拆成兩個階段:他認為機器人發展的第一個關鍵節點類似“ChatGPT時刻”,預計最快可能在明年中出現。而真正類似“DeepSeek”的全民化拐點,更可能在2027——2028年之后出現。這也是全場最明確的時間判斷。
▲國地共建人形機器人創新中心首席科學家江磊
4、蘇洋:“DeepSeek時刻”還要等,機器人安全風險遠超模型時代
蘇洋認為,目前產業鏈處在“多條技術線不同步成熟”的階段。歷史經驗顯示,機器人落地往往先從部件與末端執行器成熟開始,而真正的“DeepSeek時刻”也需要若干關鍵技術率先成熟。未來不一定是先出現通用人型,而是先出現通用靈巧手。
在討論機器人正向的社會影響時,蘇洋同樣提及了另一可能性:當一個身高1米8、體重80公斤以上并具備強控制能力的機器人進入真實環境,其潛在安全風險與反注入威脅會遠高于大模型時代。
▲靈心巧手聯合創始人、首席AI架構師蘇洋
5、曹?。盒袠I正逼近“預期頂點”,熱潮退卻還有淘汰期
曹巍認為,機器人行業正處在“預期極高,但技術非常早期”的階段,并舉例稱:“3D空間感知、連續任務推理都剛起步。”他判斷行業正在逼近預期頂點,而熱度過去后必然出現一輪淘汰。
在討論更長期的“人機關系”時,曹巍給出了另外一個視角。他認為,與機器人相處更像哲學問題,如何與機器人相處或許源自于內心對世界的理解和你本身是個什么樣的人。
▲藍馳創投合伙人曹巍
三、專題論壇:破數據、算力等核心痛點,多元路徑解鎖具身智能規模化機遇
下午場精彩再續,在具身智能人形機器人專題論壇中,來自靈御智能、優必選、云天勵飛、寬恒科技、極狐馭碼、諾亦騰機器人、詮視科技的8位嘉賓帶來深度分享。
具身智能的“不可能三角”如何破解?數據高效獲取、算力支撐不足的核心瓶頸怎樣突破?從技術研發到場景落地,如何通過工程化體系實現降本增效?千億級數據工廠的機會該如何解鎖?關于具身智能規模化發展的重要命題,或許能在這場思想碰撞中找到答案。
1、清華大學莫一林:破解具身智能“不可能三角”,遙操作是可行路徑
清華大學自動化系長聘副教授、靈御智能創始人兼首席科學家莫一林認為,具身智能發展前景明確,但要突破通用、性能和自主這一“不可能三角”,路徑仍不明確。這是因為具身智能數據量遠小于可用水平,且缺乏可靠高效低成本的數據采集方式。
同時,當下流行的聊天式交互,無法突破可控性、交互簡潔性和任務復雜性這個自主性的“不可能三角”,因此,手勢、眼神等肢體語言交互,以及“遙操作”也可能是很好的機器人交互方式。
莫一林教授提出以“遙操作”為切入點的具身智能路徑:在真實世界中采集真實數據,實現L0-L2-L4的過渡,逐步實現機器人自主化。他認為,大家在5-10年內可能會看到很多遙控機器人。此外,通過強化學習引入先驗知識可以大幅度降低對數據和仿真的需求,有助于高效地利用數據,實現更可用的具身智能。
▲靈御智能創始人兼首席科學家莫一林
2、優必選石海林:破解“從物理世界數據高效獲取知識”難題,加速具身智能成熟與應用
優必選研究院AI大模型與交互部負責人石海林提到,人形機器人是緩解制造業人力供需矛盾的關鍵一環。人工智能的下一波浪潮,是以人形機器人為代表的具身智能,當下最大的挑戰是具身智能技術如何在現實場景中達到穩定、量產交付的水平。
石海林提到,要充分發揮人工智能對比人腦智能的優勢,關鍵是從數據中高效獲取知識。具身智能需要從物理世界環境中高效獲取數據。
優必選基于大語言模型,讓機器人聽懂人類的語言指令、聽懂人類的語言評價,實現交互式學習。為此,優必選自研了千億參數基座多模態大模型Thinker,在多項國際公共benchmark上達到排名第一的性能效果,并且應用在優必選Walker S2的交互式強化學習和任務規劃。今年Q4,Walker S2正式開啟量產交付。
▲優必選研究院AI大模型與交互部負責人石海林
3、云天勵飛羅憶:用算力積木破解具身智能算力挑戰,將推第五代GPNPU架構
云天勵飛副總裁羅憶談道,AI技術發展經歷了邏輯推理、專家系統到AI人機協同的三次浪潮,大模型的出現為機器人從專業走向通用帶來曙光,并帶來了從“懂控制”到“會思考”的范式變化。但當下,具身智能仍面臨算法與數據、技術路線選擇、算力瓶頸等多方面的挑戰。
從AI芯片視角來看,國內廠商給出了具身智能算力新路徑:云天勵飛在其四代NPU的基礎上,正研發第五代GPNPU架構Nova 500,將可無縫對接CUDA生態,適配各類大模型架構,并通過領先的“算力積木”等技術,顯著提升大模型推理效率,推動具身智能破解算力挑戰。
目前,其多款芯片模型作為協處理器賦能了普渡科技、賽特智能等客戶落地項目;落地廣東某區機器人指揮平臺,實現“感知-決策-處置-確認”的業務閉環,支持多形態機器人的統一管理調度。
▲云天勵飛副總裁羅憶
4、寬恒科技龍孝晗:做好具身“服務商”,深度理解場景、數據、模型痛點
寬恒科技副總裁龍孝晗提到,各類機器人公司的背后,都要有強大的算力支撐平臺來做服務,做好這件事并不容易,要深入了解企業的場景、數據、模型。
在他看來,人工智能過去數十年的發展,是一個技術收斂的過程,如今收斂到“Transformer+GPU”的技術范式,進而催生產業的發展。
當下,VLA范式通過龐大的端到端模型,統一處理多模態感知輸入,實現視覺、語言與動作信息的深度融合。
龍孝晗提到,寬恒科技可以幫助在做“大腦”或“小腦”相關的企業去構建更高效的開發平臺,讓底層算力的使用更加經濟合理。寬恒科技有AI管理云服務平臺,可以提供具身智能全鏈解決方案。
▲寬恒科技副總裁龍孝晗
5、極狐馭碼張揚:融合AI與DevOps方法論構建Code2Real工程化體系,加速具身智能場景化落地
針對機器人強化學習場景面臨的典型挑戰,極狐馭碼解決方案高級總監張揚提出四項關鍵實踐以全面實現模型開發的高效率與可追溯:一是統一所有研發核心資產的管理,通過元數據實現語義化版本;二是將安全合規前置至開發生命周期,及早識別并以低成本規避安全風險;三是采用基礎設施即代碼(IaC)實踐,保障訓練環境的一致性與彈性伸縮;四是通過訓練與部署流水線的構建,實現交付過程的高度自動化。
同時極狐馭碼將AI能力深度融入到Code2Real全流程,通過AI加持的編碼輔助、技術問答、安全報告分析、代碼評審及流水線管理等能力,進一步提速從代碼到實體的全流程。并顯著降低工程師技術上手門檻,為規?;涞貏撛鞐l件。
根據在合作企業中落地實踐的數據統計,Code2Real研發工程化體系的年度ROI可達140%-260%,為具身智能研發的降本增效提供了有力支撐。
▲極狐馭碼解決方案高級總監張揚
6、詮視科技林瓊:從感知模組到MR交互,三大裝備破解具身智能數據瓶頸
詮視科技創始人兼CEO林瓊談道,沉浸式的“XR+AI”空間計算正落地千行百業,這離不開人/機器人與環境的交互。背后是交互范式的顛覆創新、智能感知與環境理解的革命、內容生成的工業化變革以及邊緣計算與云端的協同,這也成為具身智能發展的重要技術基礎。
面向具身智能,詮視科技產品落地的第一站聚焦具身智能的核心部件,推出SeerSense系列空間計算視覺感知模組,助力智能機器人自主導航,核心性能比肩英特爾RealSense系列;第二站聚焦機器人與人的交互,推出SeerLens系列MR眼鏡,具備智能感知和自然交互能力,可用于具身智能無本體訓練、多終端互聯等場景;其還推出自追蹤6DoF手柄,助機器人遙操作、數據采集與模型訓練,破解具身智能發展的關鍵瓶頸。
▲詮視科技創始人兼CEO林瓊
7、諾亦騰機器人唐新民:具身“數據工廠”是千億級大機會,手握動捕王牌提供全鏈路方案
當前,具身智能需要來自真實物理世界的多模態信息,包括動作、視覺、力覺、觸覺和語言等,“數據”已成最突出挑戰之一。
諾亦騰機器人深耕動捕十三年,在動捕領域全球市占率超過70%,設備出貨超過2.5萬套。
唐新民提到,在遙操數據采集方面,通過人進行動作捕捉是最為精準的,同一個人的數據可以映射到不同類型的人形機器人平臺上,提升效率。
諾亦騰機器人可以提供從真機到人類交互的全鏈路數據解決方案,他們提出了具身智能數據金字塔概念,最上層的真機遙操作數據和第二層高精度人類交互數據是諾亦騰重點聚焦的。
唐新民提到,具身智能的“數據工廠”是一個千億級別的大機會,但要做好并不容易。
▲諾亦騰機器人合伙人唐新民
四、圓桌對話:中美具身智能競賽差異化凸顯,具身智能GPT時刻10年內或將至
最后圓桌對話以《具身智能人形機器人產業化——啟幕時刻的機遇與破局》為主題,由智一科技聯合創始人、智猩猩總經理何峰主持,深圳賽博格機器人聯合創始人&首席算法科學家、華南理工大學未來技術學院副教授張懷東,優必選研究院AI大模型與交互部負責人石海林,云天勵飛副總裁羅憶,詮視科技創始人&CEO林瓊,諾亦騰機器人合伙人唐新民五位嘉賓進行分享。
▲智一科技聯合創始人、智猩猩總經理何峰
1、中美具身智能格局:本體層中國發展更快,模型層競爭激烈
針對具身智能行業今年發生的改變以及面臨的挑戰,五位嘉賓從各自所處賽道進行了分析。
張懷東認為出現了性能較好的靈巧手,但當下國內具身智能相關標準欠缺且國內資本投入較少。
▲華南理工大學未來技術學院副教授張懷東
石海林看到了人形機器人在工業場景的數據回流結構化要求提升,但其挑戰是穩定量產交付、達到客戶預期。
▲優必選研究院AI大模型與交互部負責人石海林
羅憶認為人形機器人的行業和市場信心回歸,可以更理性看待不足。唐新民站在中美發展差距上提到,中國在本體方面甚至強過美國,模型方面中美競爭激烈,并且幾十萬小時數據訓練出來的模型展現出泛化趨勢。
唐新民和林瓊都提到人形機器人普遍面臨的數據瓶頸,業界仍在探索如何獲取數據、挖掘數據價值。
▲諾亦騰機器人合伙人唐新民
2、具身智能GPT時刻之爭,明年技術、資本、數據齊發力
關于具身智能爆發的GPT時刻,五位嘉賓的觀點分為兩類。
一類給出了具體時間期限,石海林稱具身智能GPT時刻的發生不會晚于2028年底,林瓊認為這一時刻會在10年內到來。
另一類則認為很難預測。羅憶認為標志性事件是有100萬臺機器人進入工廠。針對王興興之前提到的高算力芯片難以用于人形機器人,羅憶認為客觀來講,這是因為目前還沒有一顆真正為機器人定制的芯片出現。
▲云天勵飛副總裁羅憶
最后他們還提到對2026年的展望,張懷東認為明年會看到大的公司下場;石海林看好具身智能技術會在實際場景中做到突破;羅憶希望明年看到更多機器人進工廠的新聞上熱搜;林瓊認為具身智能數據采集會成為新的商業化機會;唐新民稱明年將看到百萬小時數據訓練出來的模型。
▲詮視科技創始人&CEO林瓊
五、結語:從走跑跳到拼落地,中國機器人產業綜合優勢顯現
近10年來,智一科技持續追蹤機器人與具身智能領域,見證了行業從技術萌芽到逐步產業化的關鍵歷程,以及眾多產學研團隊的深耕求索。
這場大會折射出的最大共識是,具身智能和人形機器人,已經從上半場拼走跑跳,轉向下半場比拼機器人從單場景示范邁向可復制、可規模化的通用能力,以及如何打造長期、可控的商業模式。
在這機器人產業發展的重要節點上,中國在本體制造、場景土壤、工程人才和產業鏈完整度上的綜合優勢正在開始顯現??梢灶A見,在未來十年,具身智能不會以一夜奇點方式到來,而會通過無數臺機器人在真實場景中的長期運行、無數小時數據的持續積累,悄然完成從炫技時刻到基礎設施的身份轉變。