2025年7月29日  星期二
首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 移動(dòng)互聯(lián)網(wǎng) >> 正文

零次方機(jī)器人啟動(dòng)全模態(tài)數(shù)據(jù)采集中心,破解具身智能“卡脖子”難題

2025年6月24日 10:45  CCTIME飛象網(wǎng)  

6月,國(guó)內(nèi)首家實(shí)現(xiàn)專項(xiàng)場(chǎng)景超長(zhǎng)序列多任務(wù)連貫操作機(jī)器人公司——零次方行業(yè)創(chuàng)新再突破,正式發(fā)布“全模態(tài)”具身數(shù)據(jù)全鏈路解決方案。方案旨在解決具身智能模型訓(xùn)練普遍存在的“數(shù)據(jù)模態(tài)缺失、數(shù)據(jù)采集流程繁瑣、任務(wù)數(shù)據(jù)管理繁雜、模型訓(xùn)練推理部署門檻高”等難題,涵蓋了:“全模態(tài)”數(shù)據(jù)采集設(shè)備、數(shù)據(jù)采集與管理平臺(tái)、模型訓(xùn)練、模型推理方案。

解決方案圖示

面向未來(lái)3-5年具身數(shù)據(jù)需求設(shè)計(jì)

技術(shù)路線上:當(dāng)前具身智能模型的發(fā)展仍處于發(fā)展期,各研究團(tuán)隊(duì)的技術(shù)路線逐漸向更豐富的模態(tài)探索:

• 視覺(jué)-關(guān)節(jié)融合方案(如ACT、Diffusion Policy、DP3等):通過(guò)聯(lián)合嵌入視覺(jué)信息與機(jī)器人本體感知,利用本體數(shù)據(jù)補(bǔ)償視覺(jué)觀測(cè)歧義性,提升動(dòng)作泛化能力,但因缺乏力學(xué)反饋,在物理交互密集型任務(wù)中適應(yīng)性不足。

• 語(yǔ)義-視覺(jué)-關(guān)節(jié)融合方案(如Pi0、GROOT等):引入語(yǔ)義信息(如語(yǔ)言指令/場(chǎng)景描述)增強(qiáng)環(huán)境與長(zhǎng)序列任務(wù)的理解,結(jié)合視覺(jué)與關(guān)節(jié)狀態(tài)實(shí)現(xiàn)多模態(tài)決策,提升復(fù)雜任務(wù)泛化性。

• 視覺(jué)-關(guān)節(jié)-力聯(lián)合建模(如RDP等)引入力/觸覺(jué)反饋構(gòu)建物理表征,提升泛精密操作的魯棒性;

• 更為齊全的模態(tài)架構(gòu)正成為新趨勢(shì),通過(guò)跨模態(tài)對(duì)齊實(shí)現(xiàn)環(huán)境-物理-語(yǔ)義的協(xié)同推理。

在此背景下,零次方機(jī)器人數(shù)據(jù)采集中心的全模態(tài)數(shù)據(jù)架構(gòu)具備雙重核心優(yōu)勢(shì):

1. 維度兼容性:全模態(tài)數(shù)據(jù)高維數(shù)據(jù)可自然降維生成任意子模態(tài)數(shù)據(jù)集(如剝離力觸覺(jué)獲得純視覺(jué)-關(guān)節(jié)數(shù)據(jù)),兼容現(xiàn)存所有算法范式的訓(xùn)練需求;

2. 價(jià)值持續(xù)性:預(yù)設(shè)傳感器冗余通道,集成工具標(biāo)注對(duì)齊多模態(tài)數(shù)據(jù)流,為正在演進(jìn)的VLA、跨模態(tài)對(duì)齊、物理因果推理、世界模型等等未來(lái)3-5年可能涌現(xiàn)的具身模型提供燃料。

這種前瞻性設(shè)計(jì)能兼容當(dāng)下技術(shù)生態(tài)、支撐長(zhǎng)期算法進(jìn)化的“高維數(shù)據(jù)基座”。此外,零次方的“全模態(tài)”數(shù)據(jù)采集人形機(jī)器人 ZERITH-H1,完美兼顧零次方機(jī)器人數(shù)據(jù)采集中心的全模態(tài)數(shù)據(jù)架構(gòu)設(shè)計(jì),實(shí)現(xiàn)全模態(tài)數(shù)據(jù)采集與落地。

“全模態(tài)”數(shù)采人形機(jī)器人 ZERITH-H1

ZERITH-H1采用高度擬人化的上肢結(jié)構(gòu)設(shè)計(jì),其關(guān)節(jié)自由度布局嚴(yán)格參照人體工學(xué),并顯著擴(kuò)展了關(guān)節(jié)活動(dòng)范圍。特別設(shè)計(jì)的升降柱式構(gòu)造有效抬升機(jī)身,大幅消除腿部空間占用,最終實(shí)現(xiàn)超越成年男性的靈活操作空間。

1750731915857780.png

高維度“全模態(tài)”傳感器設(shè)計(jì):為應(yīng)對(duì)具身智能模型訓(xùn)練普遍存在的“數(shù)據(jù)模態(tài)缺失”問(wèn)題,零次方機(jī)器人在Zerith-H1設(shè)計(jì)階段即整合了各種模態(tài)的傳感器,可實(shí)現(xiàn)對(duì)二維視覺(jué)信息、三維空間信息、關(guān)節(jié)信息、力觸覺(jué)信息、聲音信息的“完整”模態(tài)信息采集。

集成觸覺(jué)感知,抓取豆腐等易碎物

特別的是,針對(duì)于力觸覺(jué)感知部分,ZERITH-H1搭載了觸覺(jué)夾爪,集成了高分辨率視觸覺(jué)傳感器,實(shí)現(xiàn)對(duì)抓取力觸覺(jué)的精準(zhǔn)感知。零次方在視觸覺(jué)傳感器方面技術(shù)積累深厚,源于清華AI&Robot實(shí)驗(yàn)室。實(shí)驗(yàn)室曾提出過(guò)超越人類觸覺(jué)感知水平的超光譜視觸覺(jué)傳感方案,相關(guān)視觸覺(jué)成果多次獲ICRA、IROS Best Paper Finalists、多次在T-RO、Soft Robotics、T-MECH上發(fā)表相關(guān)研究。

低延遲、高動(dòng)態(tài)響應(yīng)的遙操系統(tǒng):為了進(jìn)一步滿足實(shí)時(shí)同步操作的需求,零次方將機(jī)器人與采集者通訊延遲無(wú)限推進(jìn)至零延遲,實(shí)現(xiàn)“孿生式”映射同步感知;同時(shí)整體設(shè)備連續(xù)運(yùn)行時(shí)間超過(guò)4小時(shí),滿足長(zhǎng)時(shí)間不間斷的數(shù)據(jù)采集需求。

VR遙操演示

VR APP:快速構(gòu)建物理世界與虛擬世界交互渠道:基于主流vr設(shè)備自研ZERITH-VR APP,實(shí)現(xiàn)遙操作設(shè)備與機(jī)器人本體、具身數(shù)據(jù)管理平臺(tái)超低數(shù)據(jù)傳輸延時(shí)。同時(shí)通過(guò)“一鍵式”設(shè)備連接、“引導(dǎo)式”數(shù)據(jù)采集工作流,幫助用戶快速掌握復(fù)雜任務(wù)數(shù)據(jù)采集能力,確保數(shù)據(jù)收集質(zhì)量、提升數(shù)據(jù)采集效率

ZERITH-VR APP界面

具身數(shù)據(jù)采集管理平臺(tái):將采集的多元化數(shù)據(jù),轉(zhuǎn)為即用型訓(xùn)練燃料

針對(duì)數(shù)據(jù)采集任務(wù)多樣、采集流程繁雜、數(shù)據(jù)管理及可視化等需求,零次方機(jī)器人數(shù)據(jù)采集中心的自研具身數(shù)據(jù)管理平臺(tái)用于數(shù)據(jù)全流程管理,依托自身開發(fā)模型的經(jīng)歷,通過(guò)數(shù)萬(wàn)次的數(shù)據(jù)采集與測(cè)試,不斷測(cè)試數(shù)據(jù)管理平臺(tái)易用性,現(xiàn)正式對(duì)外推出具有:對(duì)具身任務(wù)數(shù)據(jù)分類、清洗、標(biāo)注、檢索模塊化高易用性的具身數(shù)據(jù)采集管理平臺(tái)。

1750731988671306.png

集成高效訓(xùn)練與部署工具鏈:讓訓(xùn)練與場(chǎng)景落地更迅捷、更簡(jiǎn)易化。

同時(shí),為讓用戶可快速、便捷式將數(shù)據(jù)集應(yīng)用于模型訓(xùn)練,零次方機(jī)器人數(shù)據(jù)采集中心的數(shù)據(jù)平臺(tái)設(shè)計(jì)兼容主流開源算法框架的標(biāo)準(zhǔn)化接口(如ACT、Diffusion Policy、DP3等);數(shù)據(jù)接口兼容對(duì)基座模型(Pi0、GROOT、ZERITH-V0等)的后訓(xùn)練(LORA、Full tuning、RL等),提供符合許可證要求的快速訓(xùn)練接入能力。

在模型訓(xùn)練過(guò)程,零次方機(jī)器人數(shù)據(jù)采集中心深度集成AI訓(xùn)練工具Swanlab,實(shí)現(xiàn)對(duì)模型訓(xùn)練的全過(guò)程記錄、實(shí)時(shí)監(jiān)控、數(shù)據(jù)可視化與批量實(shí)驗(yàn)分析,幫助用戶科學(xué)調(diào)參、管理歷史訓(xùn)練實(shí)驗(yàn)數(shù)據(jù),高效迭代自己的具身智能模型。

訓(xùn)練過(guò)程可視化監(jiān)控與記錄

在模型推理上,機(jī)器人最高可選500TOPS算力主機(jī),集成易用部署的框架,優(yōu)化推理效果,實(shí)現(xiàn)絲滑動(dòng)作執(zhí)行,真實(shí)可見的在場(chǎng)景中的落地效果。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
飛象訪談:對(duì)話InterDigital副總裁兼無(wú)線實(shí)驗(yàn)室負(fù)責(zé)人Milind Kulkarni
精彩視頻
未來(lái)出行的芯力量 向“智能移動(dòng)終端”躍遷
飛象訪談:對(duì)話InterDigital副總裁兼無(wú)線實(shí)驗(yàn)室負(fù)責(zé)人Milind Kulkarni
2025MWC上海丨中興通訊副總裁熊杰就AI萬(wàn)兆全光園區(qū)話題進(jìn)行交流
2025MWC上海|中國(guó)信科:全棧算力創(chuàng)新應(yīng)用 為AI時(shí)代構(gòu)筑數(shù)智基石
精彩專題
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會(huì)
2025世界電信和信息社會(huì)日大會(huì)
第八屆數(shù)字中國(guó)建設(shè)峰會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像