智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent 7.0,看RPA Agent的迭代升級抓取豆瓣信息、自己制作PPT,這款AI Agent真的實現(xiàn)了流程全自動化AI Agent構建到執(zhí)行全自動化,持續(xù)進化RPA Agent再次降低智能體應用門檻實在智能重磅發(fā)布實在Agent 7.0 ,這款神器做到了B端與C端通吃C端AI Agent構建與應用實現(xiàn)端到端,這個智能體構建平臺真的不一般
文/王吉偉
智能體的爆發(fā),意味著大語言模型的快速落地與應用。所以它一經(jīng)提出便如泄洪之水一發(fā)而不可收,直至現(xiàn)在如火如荼。
尤其是在智能體工作流(Agentic Workflow)的加持下,智能體表現(xiàn)出了更強的易用性和適應性。除了解決簡單工作流的自動化,也在積極融合進入更多的傳統(tǒng)業(yè)務流程和應用場景。
王吉偉頻道在《Agentic Workflow新范式,基于大語言模型的工作流、業(yè)務流程、智能體大融合》一文中提到過,廣義上的Agentic Workflow是包含傳統(tǒng)軟件(工具、解決方案)、大語言模型、AI Agent等在內(nèi)的新型業(yè)務流程的集合,其中用RPA等超自動化工具將輕量化LLM工作流與傳統(tǒng)工作流相連接的工作流,將會成為企業(yè)業(yè)務流程的重要形式。
當前的AI Agent構建平臺所構建的AI Agent通過各種插件和工作流已經(jīng)可以做到較長的流程,但仍然無法操作沒有API接口和沒有開放API的大型以及遺留的企業(yè)級應用程序,并且API接口也不能保障絕對的穩(wěn)定。
因此在智能體的應用上,用RPA來連接多種應用系統(tǒng)以保障數(shù)據(jù)的流通是不可或缺的,這對于已將RPA應用于企業(yè)運營人機交互層的組織來說則更加重要。
在企業(yè)級智能體的解決方案上,基于RPA構建的或者以RPA為tools的RPA Agent越發(fā)受到廣大組織重視,原因正是它能夠彌補單純的API類智能體的不足,可以通過“API+UI”雙重自動化極大提升智能體的應用潛力。RPA已經(jīng)成為智能體的重要技術,也是實現(xiàn)基于LLM的智能自動化的必要技術之一。
從去年LLM爆發(fā)以來,RPA\超自動化廠商們也都在持續(xù)進化,完成了RPA Agent的產(chǎn)品化進階。那么它們進化到什么程度了?在王吉偉頻道寫這個選題期間,恰好實在智能發(fā)布了最新產(chǎn)品實在Agent 7.0。這篇文章,我們就以這款產(chǎn)品為例,透視國產(chǎn)RPA Agent產(chǎn)品的發(fā)展情況。
先來看兩個例子
在詳細介紹實在Agent之前,先來看幾個實際操作案例。
案例1:采集豆瓣新片排行榜發(fā)送給同事
這是一個娛樂類的案例。如果你想為同事推薦最新的十部電影,過去需要打開豆瓣電影的新品排行榜,逐個復制電影名稱,通過微信或者釘釘發(fā)送給朋友?,F(xiàn)在使用實在Agent,只需要打開軟件,輸入 「采集豆瓣電影片排行榜前十(電影名、評分)」,它就能自動分析你的需求并拆解成執(zhí)行步驟,然后點一下 執(zhí)行 ,它就會自動采集相關數(shù)據(jù)并把數(shù)據(jù)填入到釘釘,發(fā)送給你的同事。
案例2:在騰訊文檔制做年終匯報幻燈片
這是一個辦公應用的案例。按照正常步驟操作這個業(yè)務流程,需要打開騰訊文檔,搜索相關文檔,再制作成PPT。使用實在Agent智能體,只需要告訴它 「明天要去匯報,去騰訊文檔里做一個叫年中匯報的幻燈片 」,它就會把你的需求拆解成相應的執(zhí)行步驟,然后點擊 執(zhí)行 按鈕,幾分鐘后就能在騰訊文檔走出一個幻燈片。
除了這兩個案例,實在智能還給王吉偉頻道展示了獲取百度貼吧前10個熱門貼吧相關信息、京東關注商品降價通知發(fā)送、京東購物車商品結(jié)算等案例。
王吉偉頻道還實際測試了12306查詢車次、給微信好友添加標簽及發(fā)送信息等應用案例,都能一一完成。實在Agent智能體預制了很多代表性案例,感興趣的朋友可以親自嘗試。
據(jù)悉,目前實在Agent已經(jīng)能夠?qū)︶斸?、微信、企業(yè)微信等集成辦公軟件進行精確操作,并能通過屏幕識別技術對淘寶、京東、攜程及12306等網(wǎng)站進行精確識別。
實在智能正在對更多的軟件系統(tǒng)進行適配,以后大家需要操作的工作、生活及學習等業(yè)務流程,都能通過使用自然語言與實在Agent智能體交流實現(xiàn)相應業(yè)務流程的自動化,且這些Agent流程都是可以復用的,一次創(chuàng)建多次使用。
實在Agent 7.0.0有什么特點?
以上兩個實操案例,來自于實在Agent 7.0。新版Agent 7.0具備以下幾個特點:
自然對話交互:“All in One”式助理工作體驗;意圖理解、流程規(guī)劃:更為強大的意圖理解+流程精準拆解規(guī)劃能力;多代產(chǎn)品能力集成:實現(xiàn)一代RPA、二代IPA數(shù)字員工元素拾取、組件、流程編排等全部能力集成;軟件界面精準操作:Agent多模態(tài)屏幕語義理解,屏幕掃描識別,界面精準操作;
實在智能千億參數(shù)訓練的底層TRAS大模型也再次進化,訓練參數(shù)量更大,支持自然語言溝通工作、科普知識,高效執(zhí)行任務完成工作,對話工作兩不誤。
在智能問答方面,基于實在智能文檔系統(tǒng)(IDP),能夠給實現(xiàn)文件的精確問答及處理。
此外,該公司已經(jīng)繼續(xù)深入探索企業(yè)大模型、數(shù)字員工運營管理平臺、RAG和Agentic Workflow等技術和產(chǎn)品整合研究,實在智能創(chuàng)始人孫林君曾在2024年世界人工智能大會上提到“企業(yè)大腦”解決方案。
目前它們正在逐步推出企業(yè)知識庫定制訓練服務,通過RAG讓Agent能夠回答企業(yè)內(nèi)部專屬的知識內(nèi)容和流程內(nèi)容,讓知識和流程資產(chǎn)創(chuàng)新價值。
之所以能做到這些,在于其對于技術和產(chǎn)品研發(fā)的執(zhí)著,并且產(chǎn)研投入量極大。此次版本大更新花費近一年時間,深入更新迭代了底層較多技術架構、功能架構、RPA組件等。
實在智能在RPA有6年技術沉淀,在AI有6年能力、人才等的積累,多年的技術沉淀、對市場需求的準確把握以及對技術走向的前瞻性預判,使得他們能夠在LLM與AI Agent爆發(fā)之后先一步扛起RPA Agent的行業(yè)大旗。
作為國內(nèi)首家發(fā)布明確意義上的AI Agent智能體的公司,實在智能的系列產(chǎn)品已經(jīng)先一步實現(xiàn)依據(jù)個人訴求生成工作流程、識別工作環(huán)境(瀏覽器、網(wǎng)頁、通訊軟件、工作軟件等)、自主執(zhí)行任務及流程,在保證智能體能夠在B端為廣大組織提供企業(yè)級服務的同時,也用標準化、易用化的產(chǎn)品進入C端市場服務更多個人用戶。
與Coze等Agent平臺有什么區(qū)別?
看了上面兩個案例,是不是感覺使用實在Agent超級簡單?
沒錯,使用實在Agent智能體的全部流程僅是 「輸入需求-點擊執(zhí)行-收到結(jié)果」 這么簡單,完全不用考慮其他操作,實現(xiàn)了軟件使用上的端到端。理論上,隨著軟件的不斷迭代,這種端到端的方式可以做到任何業(yè)務流程的自動化創(chuàng)建和自動化執(zhí)行。
提及智能體,目前大家更熟悉的可能是Coze、Dify、GPTs等平臺上用戶所創(chuàng)建的各種智能體。從上面的案例大家應該能夠體會到,實在Agent與它們最大的區(qū)別是在智能體構建上幾乎不需要人為參與(流程中斷時需要人為干預),都由實在Agent自行完成。
其他平臺的Agent構建方式是:人力構建智能體,智能體自動化執(zhí)行任務。實在Agent的構建方式則是:自動化構建智能體,智能體自動化執(zhí)行任務。這種方式,實現(xiàn)了從構建到執(zhí)行的全自動化。
所以,在使用實在Agent智能體時,用戶不用再像在Coze等平臺一樣通過輸入提示詞、選擇插件、搭建工作流等操作去構建一個智能體,極大地節(jié)省了用戶構建應用的時間(自動化構建可以讓用戶忙其他事情),并進一步降低了智能體的構建門檻,真正實現(xiàn)了一句話構建智能體,所想即所得。
此外,想要在智能體平臺構建能夠深度操作釘釘、微信等智能體,沒有相應的API接口是無法實現(xiàn)的,且平臺生態(tài)之間的API還存在著一定的連接安全性、限制性等問題,通過RPA模仿人類操作的形式則完成杜絕了此類問題的發(fā)生。
端到端這個術語經(jīng)常應用于B端企業(yè)級技術解決方案,主要強調(diào)技術、方案、流程及系統(tǒng)的完整性,也更強調(diào)產(chǎn)品應用的易用性和廣泛性。
實在智能的端到端,一方面可以理解為從B端到C端。因為實在智能要做的,不僅是能在B端為企業(yè)提供專業(yè)級的Agent數(shù)字員工解決方案,更要在C端為個人用戶帶來解決長尾低頻自動化需求的智能助理。從全新的實在Agent 7.0來看,他們做到了。
另一方面,還可以理解為C端的技術實現(xiàn)。實在Agent把“端到端”的技術特點和便捷特性賦予了智能體的C端構建與應用,把“RPA人人可用”的愿景進一步拓展為”Agent人人可用”。在LLM的加持下,這個愿景將會快速變?yōu)楝F(xiàn)實。
2023年8月,隨著實在Agent智能體的面世,實在智能成為國內(nèi)首家發(fā)布AI Agent智能體的AI科技公司。2024年8月,實在Agent 7.0發(fā)布后,實在智能再次成為RPA業(yè)界首家推出Agent產(chǎn)品形態(tài)的AI科技企業(yè)。
而這個進程,僅用了1年。
【王吉偉頻道,關注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務流程自動化與AI Agent,歡迎關注與交流?!?/p>
全文完
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
凌晨兩點,小王合上筆記本,揉了揉酸脹的眼睛?;艘粋€月寫出來的10萬字短劇劇本躺在硬盤里,要真正把它拍成劇,得找演員、租場地、請攝像、做后期……粗算下來少說要幾十萬,他只能把劇本繼續(xù)鎖在抽屜里。不過,現(xiàn)在小王的劇本可以“見光”了。2026年3月19日,字節(jié)跳動旗下的小云雀AI正式上線了短劇Agent
你一定遇到過這樣的場景:明明剛和AI助手聊了半個小時的項目細節(jié),退出會話后重新打開,它卻像個失憶患者一樣,連你上一輪說過什么背景信息都忘得一干二凈,你又得從頭把需求講一遍。這種“聊完就忘”的體驗,讓無數(shù)使用AI智能體的用戶深感頭疼。為了解決這一普遍困擾,騰訊云在4月3日正式推出了名為“龍蝦”的記憶服
4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸彈——全新一代開源大模型Gemma4正式發(fā)布,以極其寬松的Apache2.0協(xié)議向全球開發(fā)者免費開放。這是自2025年3月發(fā)布Gemma3以來,谷歌時隔整整一年的重大迭代。本次發(fā)布的Gemma4包含四個不同規(guī)格的版本:E2B(有效20億參數(shù))、E4
AI龍蝦也會生病。別怕,大部分病不是什么絕癥,自己在家就能治。我養(yǎng)OpenClaw一年多,總結(jié)出五種最常見的毛病,附上我的“土方子”,希望對你有用。病一:不吃食(完全不執(zhí)行任何任務)癥狀:你給了指令,它沒反應,日志里一片空白。就像龍蝦趴在塘底不動彈,碰它也不理。病因:通常是進程卡死了,或者依賴服務沒
養(yǎng)過真龍蝦的人都知道,投喂是個技術活。喂少了,龍蝦餓得互相殘殺;喂多了,剩餌壞水,整塘發(fā)病。OpenClaw這個AI龍蝦也一樣——你給它安排的任務太少,它會“閑得發(fā)慌”,反應遲鈍;你一次塞給它太多復雜任務,它會“消化不良”,要么報錯要么干一半就卡住。每天該喂幾次?我的經(jīng)驗是:每天喂兩次,早上一次簡單
養(yǎng)過真龍蝦的人都知道,苗種的好壞直接決定收成。養(yǎng)AI龍蝦也一樣——OpenClaw有不同版本,有的穩(wěn)定但功能少,有的功能多但愛“鬧脾氣”。新手該怎么選?我用自己的踩坑經(jīng)歷告訴你。版本怎么選?OpenClaw目前主要有三個分支:穩(wěn)定版(Stable)、測試版(Beta)和社區(qū)魔改版(Community
我第一次聽說OpenClaw,是在一個技術群里。有人發(fā)了一串代碼,說“這個AI龍蝦特別好養(yǎng),會自己找食吃”。我好奇點進去,結(jié)果對著終端發(fā)了一小時呆——連環(huán)境都沒搭起來。后來我才明白,養(yǎng)AI龍蝦跟養(yǎng)真龍蝦一樣,新手入門得先做足功課。第一問:我的電腦跑得動嗎?很多人以為AI龍蝦就是個聊天機器人,打開網(wǎng)頁
4月2日,字節(jié)跳動旗下火山引擎在武漢舉行的AI創(chuàng)新巡展上宣布,Seedance2.0API正式面向企業(yè)用戶開啟公測。同時,火山引擎總裁譚待在會上披露,截至今年3月,豆包大模型日均Token使用量已突破120萬億,在過去三個月內(nèi)增長一倍,比2024年5月發(fā)布時增長1000倍。Seedance2.0:從
養(yǎng)AI小龍蝦的路上,坑不少。有人被代裝服務騙了錢,有人電腦中了毒,有人收到天價賬單,還有人發(fā)現(xiàn)AI“失控”了,開始亂刪文件。如果你也遇到這些糟心事,別慌。下面這份“養(yǎng)蝦應急包”,告訴你第一時間該做什么。場景一:代裝被騙,錢打水漂了花了300塊找人遠程裝OpenClaw,結(jié)果對方收了錢就拉黑,或者裝了
把AI智能體請進電腦,就像把家里所有的鑰匙交給了一個陌生人。它能幫你打掃房間、整理文件,但萬一它“起了壞心”,或者被壞人利用了,你的家就不再安全了。這不是危言聳聽。國家互聯(lián)網(wǎng)應急中心已經(jīng)發(fā)布風險提示,指出OpenClaw的默認配置“極為脆弱”,攻擊者一旦得手,能輕易獲取系統(tǒng)控制權。微軟安全團隊也警告