必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

倪光南:發(fā)展“AI+機(jī)器人”,向新質(zhì)生產(chǎn)力加速躍遷

2025年11月5日 07:49環(huán)球時(shí)報(bào)

當(dāng)前,人工智能(AI)已經(jīng)成為助推世界科技和產(chǎn)業(yè)蓬勃發(fā)展的強(qiáng)大引擎。習(xí)近平總書記指出:“以人工智能引領(lǐng)科研范式變革,加速各領(lǐng)域科技創(chuàng)新突破!秉h的二十屆四中全會(huì)提出,加快高水平科技自立自強(qiáng),引領(lǐng)發(fā)展新質(zhì)生產(chǎn)力。在這一目標(biāo)的指引下,我國正在深入實(shí)施“人工智能+”行動(dòng)。機(jī)器人產(chǎn)業(yè)作為一個(gè)新興產(chǎn)業(yè)、未來產(chǎn)業(yè),要順勢而為,聚焦提升生產(chǎn)力,通過AI+賦能,使機(jī)器人產(chǎn)業(yè)向新質(zhì)生產(chǎn)力加速躍遷,成為“AI+機(jī)器人產(chǎn)業(yè)”,為國民經(jīng)濟(jì)、為人民的生產(chǎn)生活,創(chuàng)造更大的經(jīng)濟(jì)效益和社會(huì)效益。

發(fā)展機(jī)器人產(chǎn)業(yè)并不是要替代人類

我們要明白,機(jī)器人是拓展人類的能力完成任務(wù),而不是替代人類。

人類大腦的起源和演化經(jīng)歷了漫長而復(fù)雜曲折的過程。今天作為智人的我們,其繁盛興起得益于偶然性和在自然環(huán)境中的適應(yīng)性。我們的祖先克服了其他類人物種沒能克服的困難,那時(shí)地球上的智人既不是最強(qiáng)壯的,不是行動(dòng)最迅捷的,也不是數(shù)量最多的(螞蟻和磷蝦的數(shù)量要比人類多得多)。應(yīng)當(dāng)說,是龐大和復(fù)雜的大腦使我們有能力去適應(yīng)和影響這個(gè)星球。

大腦是目前宇宙中最復(fù)雜的物質(zhì)集合,其進(jìn)化讓人類成為生物界中的最高級動(dòng)物。Meta首席科學(xué)家、圖靈獎(jiǎng)的獲得者楊樂昆教授在一次報(bào)告中提到,“一個(gè)典型的大語言模型大約是10的14次方字節(jié)信息量的基礎(chǔ)上訓(xùn)練出來的,這幾乎是互聯(lián)網(wǎng)上所有公開文本的總和。一個(gè)人要花幾十萬年才能讀完這些材料,這是海量的信息!钡竽P蛢H僅依賴文本訓(xùn)練是不夠的,我們還要繼續(xù)探究經(jīng)過數(shù)億年進(jìn)化的大腦的奧秘。生成式AI的出現(xiàn)預(yù)示著未來深層經(jīng)濟(jì)結(jié)構(gòu)的重塑,當(dāng)我們謀劃發(fā)展機(jī)器人產(chǎn)業(yè)時(shí),應(yīng)當(dāng)深刻地思考人和機(jī)器人之間的關(guān)系和變革,包括對知識(shí)工作的重新定義和勞動(dòng)力結(jié)構(gòu)的重塑,而不是簡單地以機(jī)器人大規(guī)模替代人類。為此,要聚焦提升生產(chǎn)力,通過AI+賦能,使機(jī)器人產(chǎn)業(yè)向新質(zhì)生產(chǎn)力加速躍遷,讓機(jī)器人作為人類能力的擴(kuò)展去高效完成任務(wù),機(jī)器人帶來的將不是崗位的終結(jié),而是工作任務(wù)的重構(gòu)。

我們要研究不同工業(yè)化時(shí)期制造業(yè)的變化和機(jī)器人的定位。在不同工業(yè)化時(shí)期,對制造業(yè)而言工廠的定位是在變化的。德國提出了工業(yè)化4.0(即第四次工業(yè)革命),中國則處于從傳統(tǒng)工業(yè)化發(fā)展到新型工業(yè)化的階段。隨著人工智能引領(lǐng)的科技變革的推進(jìn),中國大多數(shù)企業(yè)將從自動(dòng)化發(fā)展到智能化,生產(chǎn)模式將從剛性化、標(biāo)準(zhǔn)化,發(fā)展到柔性化、定制化兼?zhèn)洹?/P>

機(jī)器人將從過去自動(dòng)化工具逐漸過渡到“AI+機(jī)器人”;機(jī)器人的控制者從過去的實(shí)時(shí)操作系統(tǒng)發(fā)展到“AI+機(jī)器人”智能系統(tǒng);自動(dòng)化機(jī)器人交互用按鈕、鍵盤、鼠標(biāo)、屏幕,“AI+機(jī)器人”可增加語音交互等;自動(dòng)化機(jī)器人用人工編程,“AI+機(jī)器人”依賴大模型;自動(dòng)化機(jī)器人在固定工位工作,“AI+機(jī)器人”是多工位自主移動(dòng)工作;自動(dòng)化機(jī)器人需要提前部署、調(diào)整、編程,“AI+機(jī)器人”將實(shí)現(xiàn)即插即用;自動(dòng)化機(jī)器人是人機(jī)分工、難以互動(dòng),“AI+機(jī)器人”是人機(jī)協(xié)同、取長補(bǔ)短。總之,“AI+機(jī)器人”是今后機(jī)器人的發(fā)展方向,機(jī)器人的形狀會(huì)多樣化,也許會(huì)根據(jù)場景需求以最經(jīng)濟(jì)合理的方式完成具體任務(wù)。

機(jī)器人要用起來必須注重三大核心智能協(xié)同

從現(xiàn)有產(chǎn)業(yè)現(xiàn)狀著眼,中國機(jī)器人產(chǎn)業(yè)發(fā)展的關(guān)鍵是提升機(jī)器人智能等級。機(jī)器人的控制需要從過去“機(jī)器人操作系統(tǒng)”,發(fā)展到“機(jī)器人智能系統(tǒng)”。一般認(rèn)為,三大核心能力支撐著機(jī)器人智能系統(tǒng):一是“眼睛”即機(jī)器人環(huán)境感知能力;二是“行動(dòng)”即運(yùn)動(dòng)控制能力;三是“大腦”即交互決策能力。三者互相融合而又相對獨(dú)立,協(xié)同構(gòu)成一個(gè)機(jī)器人智能系統(tǒng)。目前我國機(jī)器人產(chǎn)業(yè)對運(yùn)動(dòng)控制(“行動(dòng)”)的投入較大,而對環(huán)境感知(“眼”)和交互決策(“腦”)的投入不足,迫切需要提升。

大語言模型構(gòu)成了“機(jī)器人之腦”。機(jī)器人智能系統(tǒng)以“腦”為核心,基于大語言模型的“腦”推進(jìn)了從“機(jī)器人操作系統(tǒng)” 到“機(jī)器人智能系統(tǒng)”的技術(shù)架構(gòu)性變革。大語言模型帶來的是效率提高和工作流程的再設(shè)計(jì),在大模型加持下,機(jī)器人能自主實(shí)施知識(shí)積累、接受指令、動(dòng)作實(shí)施、人機(jī)交互等等。大模型將提供相應(yīng)的工作流程,引導(dǎo)機(jī)器人完成各種任務(wù)。

AI+空間計(jì)算作為“機(jī)器人之眼”,開啟機(jī)器人認(rèn)識(shí)世界的新范式。根據(jù)生物智能進(jìn)化原理,眼睛是生物進(jìn)化中智能的起點(diǎn)。機(jī)器人智能系統(tǒng)要突出“眼”的作用,以AI+空間計(jì)算作為機(jī)器人眼睛的支撐是適合的,能以“類人眼”方式采用普通單目攝像頭+神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),預(yù)先對環(huán)境進(jìn)行學(xué)習(xí)訓(xùn)練,提升對物理世界的感知和理解,并具有自適應(yīng)和持續(xù)學(xué)習(xí)能力,實(shí)現(xiàn)機(jī)器人睜開眼睛看世界,具有好用、易用、實(shí)用等特點(diǎn)。

空間計(jì)算作為一種面向三維世界的計(jì)算模式,正在重塑人類、機(jī)器和世界的交互方式,是推動(dòng)機(jī)器人落地的關(guān)鍵核心技術(shù)之一。歷史上人機(jī)交互范式經(jīng)歷了從電報(bào)、文字到語音、圖形、視頻等的發(fā)展,當(dāng)前我們正從二維向三維新的交互范式轉(zhuǎn)變,空間計(jì)算是引領(lǐng)這種交互范式變革的重要技術(shù)支撐?臻g計(jì)算是對物理世界的“重構(gòu)”,生成式AI并不能替代。今天生成式大語言模型的發(fā)展很快,但并不能覆蓋我們世界的全部。來自物理世界的數(shù)據(jù)復(fù)雜、模態(tài)多樣,目前大模型還不能輕易解析出視頻、動(dòng)作、物理規(guī)則等等。

AI+空間計(jì)算的融合創(chuàng)新,有望打破物理世界和數(shù)字世界的界限,引領(lǐng)我們進(jìn)入新的信息時(shí)代,是支撐低空經(jīng)濟(jì)、機(jī)器人等產(chǎn)業(yè)發(fā)展的關(guān)鍵技術(shù)。它與傳統(tǒng)機(jī)器視覺的不同在于:它是采用AI+空間計(jì)算重構(gòu)物理世界,而后者往往是基于多種物理硬件的疊加去看世界。

開源AGIROS支撐“機(jī)器人行動(dòng)”,有助于機(jī)器人產(chǎn)業(yè)生態(tài)建設(shè)。AGIROS是由中國科學(xué)院軟件所支持、擬定為標(biāo)準(zhǔn)的開源機(jī)器人操作系統(tǒng)。其開源社區(qū)由中國科學(xué)院軟件所倡議發(fā)起,旨在通過凝聚機(jī)器人產(chǎn)學(xué)研用各方力量,全面推進(jìn)智能機(jī)器人領(lǐng)域的開源開放、協(xié)同創(chuàng)新,為智能機(jī)器人產(chǎn)業(yè)夯實(shí)基礎(chǔ)。迄今為止,已有大批機(jī)器人領(lǐng)域的產(chǎn)學(xué)研用等單位和廣大開發(fā)者加入這一社區(qū)。

我們相信,借助開源的力量,AGIROS將大大增強(qiáng)AI+機(jī)器人的“腦、眼、行動(dòng)”協(xié)同系統(tǒng)的競爭力,在全球機(jī)器人業(yè)界引領(lǐng)潮流,成為傳統(tǒng)機(jī)器人躍升為AI+機(jī)器人的主要推動(dòng)力量。

構(gòu)建“基于RISC-V架構(gòu)的AI+機(jī)器人”生態(tài)系統(tǒng)

歷史上,信息技術(shù)領(lǐng)域出現(xiàn)過一些規(guī)模龐大的生態(tài)系統(tǒng),如“Wintel”“AA”,正在興起的還有“RV+OSS”,包括“RV+OpenHarmony”“RV+openKylin”等等,這些都是面向人類的信息技術(shù)生態(tài)。未來面向“AI+機(jī)器人”可能也會(huì)形成類似的生態(tài)系統(tǒng),例如本文討論的“基于RISC-V架構(gòu)的AI+機(jī)器人” 那樣的生態(tài)系統(tǒng)(即RV芯片+腦、眼、行動(dòng)智能系統(tǒng))。

我們希望中國機(jī)器人業(yè)界為這個(gè)生態(tài)作出更大貢獻(xiàn),大家共同努力構(gòu)建一個(gè)人機(jī)共融的世界,讓機(jī)器人成為我們能力的擴(kuò)展,幫助人類實(shí)現(xiàn)所向往的美好生活。讓我們幫助機(jī)器人構(gòu)建一個(gè)屬于它的智能系統(tǒng),來看見世界、理解世界、行動(dòng)于世界。(作者是中國工程院院士)

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像