當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

新華網(wǎng)專訪它石智航首席科學(xué)家丁文超,揭秘全球首個(gè)「能干活」的通用具身大模型AWE3.0

 2026-03-19 11:20  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  一鍵部署OpenClaw

在剛剛落幕的AWE2026上,它石智航不僅以全棧技術(shù)首秀成為展館焦點(diǎn),更迎來(lái)了新華網(wǎng)的專程探訪與深度報(bào)道。

本次新華網(wǎng)報(bào)道深度聚焦它石智航發(fā)布全球首個(gè)「能干活」的通用具身大模型AWE3.0、從數(shù)據(jù)采集到本體執(zhí)行的全棧技術(shù)閉環(huán)、以及創(chuàng)造全新的吉尼斯世界紀(jì)錄等諸多亮點(diǎn),首席科學(xué)家丁文超博士現(xiàn)場(chǎng)詳解機(jī)器人大腦如何賦能物理世界。

以下為新華網(wǎng)報(bào)道原文:

新華網(wǎng)北京3月18日電 2025年2月,上海一間普通的辦公室里,它石智航剛剛成立。

會(huì)議室里的白板寫(xiě)滿了公式和架構(gòu)圖,它石幾位聯(lián)創(chuàng)圍坐在一起討論。窗外春寒料峭,屋內(nèi)卻熱氣騰騰——他們剛剛決定,要做一件"瘋狂"的事:讓機(jī)器人真正走出實(shí)驗(yàn)室,走進(jìn)工廠,去干那些人類覺(jué)得枯燥、危險(xiǎn)、卻又至關(guān)重要的活兒。

一年后,2026年3月的AWE展會(huì)現(xiàn)場(chǎng),它石智航首席科學(xué)家丁文超博士站在它石的展臺(tái)前,看著A1機(jī)器人在一小時(shí)內(nèi)完成超百次亞毫米級(jí)線束的完整裝配任務(wù)。接過(guò)吉尼斯世界紀(jì)錄證書(shū)的那一刻,他想起了白板上的那些涂鴉。"我們做到了,"他對(duì)記者說(shuō),"不是炫技、不是表演,是真的能創(chuàng)造價(jià)值、能干活的機(jī)器人。"

今年的政府工作報(bào)告提出"因地制宜發(fā)展新質(zhì)生產(chǎn)力"。在丁文超看來(lái),具身智能正是AI與實(shí)體經(jīng)濟(jì)深度融合的下一個(gè)主戰(zhàn)場(chǎng),而它石要做的,就是打破"實(shí)驗(yàn)室樣品"與"產(chǎn)線熟練工"之間那堵看不見(jiàn)的墻。

看見(jiàn)機(jī)器人大腦:從VLA到物理世界理解

過(guò)去幾年,丁文超看過(guò)太多機(jī)器人的“表演”。在實(shí)驗(yàn)室里,在展臺(tái)上,在精心布置的場(chǎng)景中,機(jī)器人可以打開(kāi)水瓶、疊好衣服。但只要換個(gè)角度、換個(gè)環(huán)境,它們就“懵”了。

問(wèn)題出在哪?當(dāng)前具身智能的主流架構(gòu)是VLA(視覺(jué)語(yǔ)言動(dòng)作模型),但丁文超認(rèn)為這遠(yuǎn)遠(yuǎn)不夠。“VLA處理的本質(zhì)是‘視網(wǎng)膜級(jí)’信息——像素、顏色、輪廓。但它石追求的是對(duì)時(shí)間、空間、力及環(huán)境交互等物理量,以及世界本質(zhì)信息的精準(zhǔn)表達(dá)。比如線形變了手會(huì)調(diào)整角度,針刺進(jìn)布里知道用力還是拉直——這些物理直覺(jué),VLA給不了。”

它石智航本次發(fā)布的全球首個(gè)能干活的通用具身大模型AWE3.0,核心突破在于對(duì)物理世界的感知、理解和規(guī)劃。該模型采用自研AI world Engine架構(gòu),進(jìn)一步擺脫視角依賴,具備人類般的精細(xì)流暢操作能力、長(zhǎng)程任務(wù)穩(wěn)定執(zhí)行能力,以及跨場(chǎng)景遷移與泛化能力,完美詮釋了“走出溫室、落地干活、通用泛化”的核心定位,更繼承了對(duì)空間規(guī)律與物理法則“知其然,更要知其所以然”的理解、預(yù)測(cè)與推理能力。

這種能力的底層是“隱空間”技術(shù)——將人類動(dòng)作精髓壓縮為模型,機(jī)器人不需要記住每一個(gè)動(dòng)作軌跡,而是理解動(dòng)作生成的底層邏輯。“我們借助隱空間的絲滑動(dòng)作生成技術(shù),讓機(jī)器人的操作行云流水、穩(wěn)定可靠,更將長(zhǎng)程任務(wù)執(zhí)行能力提升至全新高度。”丁文超表示。

在它石AWE展臺(tái)正前方的大腦演示區(qū),機(jī)器人業(yè)內(nèi)首次對(duì)外直觀展示了這種能力。觀眾可在PAD上選擇酒店、廚房、工廠、辦公等任意場(chǎng)景,并選取拿取、整理、清潔等對(duì)應(yīng)任務(wù)。機(jī)器人在學(xué)習(xí)人類真實(shí)數(shù)據(jù)并完成未來(lái)推理后,左屏實(shí)時(shí)呈現(xiàn)真實(shí)場(chǎng)景畫(huà)面,右屏則同步展示點(diǎn)云、關(guān)鍵參數(shù)、運(yùn)動(dòng)軌跡等學(xué)習(xí)數(shù)據(jù),直觀揭示了機(jī)器人如何通過(guò)海量數(shù)據(jù)學(xué)習(xí),實(shí)現(xiàn)對(duì)環(huán)境的深度理解與任務(wù)的精準(zhǔn)執(zhí)行。

“我們想讓觀眾看到,機(jī)器人是怎么認(rèn)識(shí)世界、怎么思考、怎么推理未來(lái)的。”丁文超說(shuō)。

數(shù)據(jù)與觸覺(jué):讓機(jī)器人“長(zhǎng)出手感”的真實(shí)燃料

精細(xì)操作是具身智能最難啃的骨頭。尤其是線束裝配這類復(fù)雜、柔性要求高的工業(yè)場(chǎng)景。

它石的答案是HTS(高密度觸覺(jué)感知)技術(shù),本質(zhì)是將觸覺(jué)反饋閉環(huán)引入控制。讓機(jī)器人擁有堪比人類的觸覺(jué)感知能力,能捕捉細(xì)微的數(shù)據(jù)變化,實(shí)現(xiàn)靈活應(yīng)變。

傳統(tǒng)機(jī)器人力控基于關(guān)節(jié)電流反饋,遇到阻力就停。但線束裝配需要“連續(xù)觸覺(jué)”:插接過(guò)程中阻力變化多樣,機(jī)器人需實(shí)時(shí)感知并微調(diào)。HTS讓AWE3.0大幅提升了機(jī)器人對(duì)物理接觸的局部感知和局部響應(yīng)能力,由此機(jī)器人能夠真正勝任精密裝配、線束插接等接觸密集和柔性操作場(chǎng)景,精細(xì)操作能力達(dá)到可落地、可泛化、可規(guī)?;漠a(chǎn)業(yè)標(biāo)準(zhǔn)。 

“手上有感覺(jué),干活才靠譜。”丁文超強(qiáng)調(diào)。

而數(shù)據(jù)是這一切的基礎(chǔ)。具身智能行業(yè)長(zhǎng)期困于數(shù)據(jù)瓶頸:仿真數(shù)據(jù)量大但物理真實(shí)性不足,與現(xiàn)實(shí)存在“仿真-現(xiàn)實(shí)鴻溝”;遙操作數(shù)據(jù)真實(shí)但效率低。它石選擇了第三條路:以人為中心的數(shù)據(jù)采集(Human Centric)。

在這條數(shù)據(jù)采集路線背后,是它石始終貫穿的、對(duì)“有用”的頂層思考:為保障數(shù)據(jù)優(yōu)質(zhì)精細(xì),它石智航未采用二指夾具、外骨骼等簡(jiǎn)化設(shè)備,而是自主研發(fā)高精度視SenseHub數(shù)據(jù)采集系統(tǒng),采用可采集全量信息的五指手套,完整捕捉手部空間位姿、手指姿態(tài)及操作力度。該套件實(shí)現(xiàn)感知、計(jì)算與傳輸?shù)纳疃热诤?,為大?guī)模、高質(zhì)量的自然真實(shí)人類行為數(shù)據(jù)采集,提供了完整的系統(tǒng)解決方案。

硬件只是基礎(chǔ),真正的創(chuàng)新在于采集范式:它石讓真實(shí)的從業(yè)者——工廠老師傅、產(chǎn)線工人、保潔阿姨等,佩戴近乎無(wú)感的輕量采集設(shè)備在真實(shí)環(huán)境中工作,確保每一條數(shù)據(jù)都源于真實(shí)動(dòng)作,從而獲取海量、精準(zhǔn)的多模態(tài)數(shù)據(jù)。手套記錄的全量信息,形成了WIYH數(shù)據(jù)集,規(guī)模超百萬(wàn)小時(shí),覆蓋數(shù)萬(wàn)場(chǎng)景,精準(zhǔn)滿足具身智能對(duì)數(shù)據(jù)真實(shí)、有效、完整的訴求。

“機(jī)器人可用的數(shù)據(jù),必須同時(shí)滿足三個(gè)條件:務(wù)場(chǎng)景真實(shí)、任務(wù)有效完成、過(guò)程信息全量記錄。”丁文超表示,“這絕非在真實(shí)與仿真數(shù)據(jù)中二選一就能實(shí)現(xiàn)。”

落地與實(shí)干:從吉尼斯紀(jì)錄到產(chǎn)業(yè)賦能

在吉尼斯世界紀(jì)錄的頒證現(xiàn)場(chǎng),丁文超給全場(chǎng)觀眾講了一個(gè)故事:它石團(tuán)隊(duì)去線束工廠調(diào)研時(shí),正值盛夏,工人們額頭上全是密密麻麻的汗水。他們?cè)谌藛T密集的車間,一天重復(fù)同一個(gè)動(dòng)作成千上萬(wàn)次。那個(gè)瞬間,他記了很久。

“為什么要選擇線束這個(gè)場(chǎng)景?一是只要有電就有線束——汽車、家電、3C,每個(gè)領(lǐng)域都有海量需求;二是這是一個(gè)技術(shù)門(mén)檻極高的場(chǎng)景,理線、插拔、裝配對(duì)傳統(tǒng)機(jī)器人難度極大,因?yàn)榫€是容易形變的,接口是亞毫米級(jí)的,環(huán)境是多變的;三是要把人從這種繁重、重復(fù)、單調(diào)的體力勞動(dòng)中解放出來(lái)。”

吉尼斯紀(jì)錄驗(yàn)證了AWE3.0的工業(yè)落地能力。據(jù)丁文超介紹,當(dāng)前國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)大多仍處于基于預(yù)編程的自動(dòng)化階段,其核心是控制系統(tǒng)而非認(rèn)知系統(tǒng)。具身大腦,正是連接數(shù)字智能與物理世界的關(guān)鍵橋梁。我國(guó)雖擁有成熟的機(jī)器人本體制造能力,但在具備自主感知、認(rèn)知與決策能力的具身基礎(chǔ)模型領(lǐng)域仍存在短板。攻克“具身大腦”,是機(jī)器人產(chǎn)業(yè)實(shí)現(xiàn)核心升級(jí)的必經(jīng)之路。

從產(chǎn)業(yè)視角看,它石智航正具備補(bǔ)齊具身大腦短板的能力,讓機(jī)器人在現(xiàn)實(shí)世界落地、成為能“上崗”的生產(chǎn)力成為可能。

工業(yè)和信息化部人形機(jī)器人標(biāo)準(zhǔn)化技術(shù)委員會(huì)副主任委員兼秘書(shū)長(zhǎng)梁靚對(duì)此評(píng)價(jià):“當(dāng)前具身智能正從實(shí)驗(yàn)室驗(yàn)證向規(guī)模商業(yè)化跨越,邁入以落地應(yīng)用為核心的新階段。它石智航 AWE3.0的發(fā)布,推動(dòng)機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場(chǎng)景,實(shí)現(xiàn)了從‘會(huì)動(dòng)’到‘會(huì)想’的歷史性跨越。期待以它石為代表的創(chuàng)新企業(yè),加快成果轉(zhuǎn)化,將技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢(shì),為產(chǎn)業(yè)高質(zhì)量發(fā)展貢獻(xiàn)力量。”

從技術(shù)側(cè)深耕底層創(chuàng)新,到落地側(cè)攻克最難場(chǎng)景訴求,它石智航用實(shí)際行動(dòng),詮釋了一家踏實(shí)的具身智能企業(yè)應(yīng)有的模樣。

AWE落幕時(shí),丁文超又去展臺(tái)前站了一會(huì)兒。機(jī)器人已經(jīng)關(guān)機(jī),幾個(gè)小時(shí)后,它們會(huì)被拆箱、裝車、運(yùn)回公司繼續(xù)學(xué)習(xí)人類的真實(shí)數(shù)據(jù),繼續(xù)行走在用物理AI改變世界的道路上。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
新華網(wǎng)

相關(guān)文章

熱門(mén)排行

信息推薦