Agentic workflow加速Agentic AI到來,AI Agent成為重要實(shí)現(xiàn)方式
OpenAI定義大模型時(shí)代AI Agent,吳恩達(dá)揭開生成式Agentic AI序幕
還在討論AI Agent嗎?從Agentic Workflow開始該關(guān)注Agentic AI了
從AI Agent審美疲勞到Agentic AI引人熱議,Agentic Workflow真正火了
什么是Agentic AI?與AI Agent有什么區(qū)別和聯(lián)系?一篇文章看明白
握準(zhǔn)大模型時(shí)代商業(yè)脈搏:戰(zhàn)略層瞄準(zhǔn)Agentic AI,戰(zhàn)術(shù)層鎖定AI Agent
文/王吉偉
就在國內(nèi)還在大談特談AI Agent的時(shí)候,國外技術(shù)圈的風(fēng)向變了。他們不再談?wù)揂I Agent如何如何,而是轉(zhuǎn)頭開始交流Agentic AI。
雖然Agentic AI的概念可以追溯到上世紀(jì)IBM深藍(lán)象棋系統(tǒng)(Deep Blue chess-playing system)出現(xiàn)的90年代,但讓它再次進(jìn)入公眾視野的卻是大語言模型的真正應(yīng)用。尤其是AI Agent和Autonomous Agent的具體應(yīng)用,讓Autonomous AI再次被熱議,包含AI Agent的工作流更是直接讓Agentic AI成為AI領(lǐng)域更炙手的話題。
這個(gè)進(jìn)程與變化,仍然要感謝OpenAI。2023年6月,OpenAI應(yīng)用研究主管翁麗蓮(Lilian Weng)撰寫了《LLM Powered Autonomous Agents》一文,定義了目前很多開發(fā)者都在用的AI Agent主流技術(shù)框架。
文章地址:https://lilianweng.github.io/posts/2023-06-23-agent
2023年12月,OpenAI發(fā)表《Practices for Governing Agentic AI Systems》白皮書,介紹了Agenticness、Agentic AI Systems及Agents的區(qū)別,并正式為Agentic AI Systems下了定義。自此,Agentic AI 也正式進(jìn)入了技術(shù)人的視野。
白皮書地址:https://openai.com/index/practices-for-governing-agentic-ai-systems/
真正讓Agentic AI出圈的,還是人工智能領(lǐng)域領(lǐng)軍人物、DeepLearning.AI與Landing AI創(chuàng)始人兼CEO吳恩達(dá)教授提出的Agentic Workflow。2024年3月26日,吳恩達(dá)教授在紅杉資本(Sequoia Capital)的人工智能峰會(AI Ascent)上發(fā)表了一次主題為《Agentic Reasoning》的演講,分享了當(dāng)下AI Agent的4種主流設(shè)計(jì)模式。
在最近的2024年Snowflake峰會開發(fā)者日上,他又發(fā)表了題為《How Al Agentic workflows could drive more Al progress than even the next generation of foundation models》的演講,進(jìn)一步揭開了Agentic AI神秘面紗,并指它可能是比下一代基礎(chǔ)模型更具潛力的AI 展方向。
兩次演講,讓Agentic AI真正成為技術(shù)人所熱衷探討的話題。
AI Agent與Agentic AI 看起來非常相似,以至于看起來就像是將“AI Agent”的兩個(gè)單詞互換位置,一般人甚至看不出什么區(qū)別。但若細(xì)細(xì)品味,僅從單詞性質(zhì)名詞與形容詞的區(qū)別上,就能體會到Agent與Agentic些許不同。而作為人工智能的概念或者技術(shù)名詞,兩者所代表的意義區(qū)別還是非常明顯的。
那么,到底什么是Agentic AI?它有哪些創(chuàng)新與特性?與AI Agent有什么區(qū)別?什么又是Agentic Workflow?有哪些特征?它的四種主流設(shè)計(jì)模式又是什么?本文,從Agentic AI到Agentic Workflow,王吉偉頻道一次為大家說清楚。
(注:本文提到的相關(guān)論文、白皮書等資源已打包,后臺發(fā)消息 agentic 獲取。)
什么是Agentic AI?
在《Practices for Governing Agentic AI Systems》白皮書中,OpenAI認(rèn)為(Agentic AI systems)智能體人工智能系統(tǒng)的特征是能夠采取行動,這些行動在很長一段時(shí)間內(nèi)持續(xù)地有助于實(shí)現(xiàn)目標(biāo),而不必事先明確規(guī)定其行為。
白皮書將系統(tǒng)的智能性(Agenticness,還可以翻譯為主動性\代理性\能動性)程度定義為系統(tǒng)在有限的直接監(jiān)督下適應(yīng)性地實(shí)現(xiàn)復(fù)雜環(huán)境中的復(fù)雜目標(biāo)的程度,并將這種智能性細(xì)分為目標(biāo)復(fù)雜性、環(huán)境復(fù)雜性、適應(yīng)性和獨(dú)立執(zhí)行四個(gè)組成部分。
▲ OpenAI定義的Agentic AI Systems,來源:《Practices for Governing Agentic AI Systems》
artificiality將Agentic AI Systems定義為能夠以不同復(fù)雜性感知、推理和行動的系統(tǒng),以將人類思維擴(kuò)展到我們當(dāng)前經(jīng)驗(yàn)之外。該定義,更加強(qiáng)調(diào)了感知、推理和行動這三種能力。
基于以上兩個(gè)Agentic AI Systems定義,結(jié)合業(yè)界對于Agentic AI的各種觀點(diǎn),不難歸納出Agentic AI這一概念所代表的深刻含義。
Agentic AI(智能體AI\代理式AI\能動AI),也稱為自主AI(Autonomous AI),是指被設(shè)計(jì)用來通過理解目標(biāo)、導(dǎo)航復(fù)雜環(huán)境,并在最少的人工干預(yù)下執(zhí)行任務(wù)的系統(tǒng),能夠通過自然語言輸入獨(dú)立和主動地完成端到端任務(wù)。通常被設(shè)計(jì)為更具自主性和適應(yīng)性,不僅能處理數(shù)據(jù),還做出決策、從互動中學(xué)習(xí),并采取積極的步驟來實(shí)現(xiàn)復(fù)雜目標(biāo)。
Agentic AI可以設(shè)定目標(biāo),從互動中學(xué)習(xí),并自主做出決策,轉(zhuǎn)變業(yè)務(wù)運(yùn)營和客戶互動。功能與人類員工非常相似,可以掌握細(xì)微的環(huán)境,設(shè)定和追求目標(biāo),通過任務(wù)進(jìn)行推理,并根據(jù)不斷變化的條件調(diào)整他們的行動。
例如,雖然傳統(tǒng)AI可能協(xié)助創(chuàng)建客戶支持腳本或甚至根據(jù)客戶輸入生成個(gè)性化響應(yīng),但Agentic AI則更進(jìn)一步。它可以自主處理客戶查詢,從開始到結(jié)束解決問題,甚至根據(jù)客戶的回應(yīng)跟進(jìn)客戶。Agentic AI可以模仿人類通常用來實(shí)現(xiàn)目標(biāo)的推理、執(zhí)行和糾正航向機(jī)制,體現(xiàn)了一種更精細(xì)的技術(shù)運(yùn)作機(jī)制和管理方法。
事實(shí)上,Agentic AI背后的理念是賦予機(jī)器代理權(quán),這意味著它們可以設(shè)定目標(biāo)、規(guī)劃,并采取行動來達(dá)到這些目標(biāo)。Agentic AI能夠預(yù)測需求、建議行動,并做出與設(shè)定目標(biāo)一致的決策,其功能更像是一個(gè)合作伙伴而不僅僅是一個(gè)工具。因此,它代表了人工智能的根本轉(zhuǎn)變,旨在以最少的人工干預(yù)自主理解和管理復(fù)雜的工作流程。
Agentic AI的創(chuàng)新與特性
這里,為了體現(xiàn)Agentic AI的創(chuàng)新與特性,需要將其與傳統(tǒng)AI做一下對比。
傳統(tǒng) AI(Traditional AI),也稱為狹義AI(Narrow AI),主要在特定算法和設(shè)置規(guī)則上運(yùn)行。這些系統(tǒng)旨在執(zhí)行定義明確的任務(wù),例如對數(shù)據(jù)進(jìn)行排序、識別照片中的人臉、翻譯語言、執(zhí)行預(yù)定義的流程或基于數(shù)據(jù)庫回答常見問題解答。傳統(tǒng)人工智能的范圍僅限于其編程,缺乏偏離其給定指令或獨(dú)立學(xué)習(xí)新經(jīng)驗(yàn)的能力。
傳統(tǒng)AI擅長于狹義的任務(wù),需要在明確的指令下運(yùn)行。它能在具有明確規(guī)則的結(jié)構(gòu)化環(huán)境中茁壯成長,并在流程嚴(yán)格劃分的場景中有效運(yùn)作,但會受到其有限的范圍、對人類指導(dǎo)的依賴以及難以適應(yīng)不可預(yù)見變化的限制。
此外,傳統(tǒng)AI主要是為了自動執(zhí)行特定的重復(fù)性任務(wù),在有限的范圍內(nèi)提高速度和效率,但它們在處理需要整體理解和戰(zhàn)略判斷的復(fù)雜工作流程方面存在不足。
Agentic AI則利用大型語言模型 (LLM)、可擴(kuò)展的計(jì)算能力和龐大的數(shù)據(jù)集等進(jìn)步,提供了一種更加動態(tài)和靈活的方法。它結(jié)合了強(qiáng)化學(xué)習(xí)(RL)和決策理論,可以從互動中學(xué)習(xí)并隨時(shí)間優(yōu)化。不僅能對情況做出反應(yīng),而且能積極地參與決策過程。
可以說,Agentic AI就是為了自主性而構(gòu)建的,旨在駕馭復(fù)雜的現(xiàn)實(shí)世界場景,并能夠隨著情況的發(fā)展調(diào)整其策略。這標(biāo)志著從AI作為需要人類輸入的工具或?qū)I(yè)系統(tǒng),到作為能夠獨(dú)立行動和與現(xiàn)實(shí)世界互動的協(xié)作伙伴的深刻轉(zhuǎn)變。
Agentic AI 的功能更像是人類員工,掌握自然語言提供的復(fù)雜上下文和指令,開始設(shè)定目標(biāo),通過子任務(wù)進(jìn)行推理,并根據(jù)不斷變化的條件調(diào)整決策和行動。
因此,Agentic AI的關(guān)鍵創(chuàng)新主要體現(xiàn)于以下幾點(diǎn):
大型語言模型(LLMs):這些模型能夠理解詳細(xì)的人類語言,使人與人之間的互動更加自然,使Agentic AI能夠理解細(xì)微的人類語音和文本。
可擴(kuò)展的計(jì)算能力:增強(qiáng)的計(jì)算能力,使Agentic AI能夠管理復(fù)雜的任務(wù)并訓(xùn)練復(fù)雜的模型。
大規(guī)模數(shù)據(jù)集:通過分析大量的數(shù)據(jù),Agentic AI可以學(xué)習(xí)和隨著時(shí)間的推移提高其性能,使其更有效地處理動態(tài)環(huán)境,豐富的數(shù)據(jù)集也使其能夠理解和解釋復(fù)雜的上下文和目標(biāo)。
互聯(lián)性:Agentic AI擅長與其他系統(tǒng)和信息源連接及互動,并能夠無縫集成到現(xiàn)有的工作流程中,增強(qiáng)了其解決復(fù)雜問題和做出復(fù)雜決策的能力。
Agentic AI的主要特性,也可以總結(jié)為:
自治性:Agentic AI以高度獨(dú)立性運(yùn)作。擁有明確的目標(biāo)和對周圍環(huán)境不斷演變的理解,這些系統(tǒng)能夠自主做出決策并啟動行動,最小化對直接人類監(jiān)督的依賴。
適應(yīng)性:與它們的前身不同,Agentic AI系統(tǒng)不僵硬或脆弱。它們被設(shè)計(jì)為學(xué)習(xí)、進(jìn)化和適應(yīng)。它們通過分析模式、根據(jù)變化調(diào)整策略以及通過模擬和自省來完善決策過程,展現(xiàn)出無與倫比的靈活性。
主動性:Agentic AI不僅對外部刺激做出反應(yīng),還能主動與環(huán)境互動,尋找實(shí)現(xiàn)目標(biāo)的機(jī)會,在潛在問題完全顯現(xiàn)之前預(yù)測它們,并獨(dú)立設(shè)計(jì)解決方案。
語言理解:憑借解釋自然語言的高級能力,這些系統(tǒng)可以精確地遵循復(fù)雜的指令。
工作流程優(yōu)化:Agentic AI可在子任務(wù)和應(yīng)用程序之間高效轉(zhuǎn)換,確保以最佳方式執(zhí)行流程以實(shí)現(xiàn)預(yù)期結(jié)果。
現(xiàn)在,像CrewAI、Langraph及Autogen等開創(chuàng)性框架,正在為Agentic AI的發(fā)展鋪平道路。開發(fā)人員可以在這些平臺設(shè)計(jì)和部署AI Agent團(tuán)隊(duì),每個(gè)Agent都有獨(dú)特的技能、知識庫和通信界面。通過協(xié)調(diào)協(xié)作,這些Agent團(tuán)隊(duì)可以自主導(dǎo)航和執(zhí)行復(fù)雜的工作流程,適應(yīng)動態(tài)條件和不斷變化的需求。
擴(kuò)展閱讀:AI智能體構(gòu)建智能未來,全球80+AI Agent構(gòu)建平臺大盤點(diǎn)
這些進(jìn)步,使Agentic AI能夠超越僅僅遵循指令來設(shè)定獨(dú)立目標(biāo)、制定戰(zhàn)略和適應(yīng),從而為實(shí)現(xiàn)復(fù)雜目標(biāo)提供動態(tài)方法。
Agentic AI與AI Agent的區(qū)別
雖然AI Agent這個(gè)詞組與Agentic AI長的很像,基本就是“AI在后”與“AI在前”的區(qū)別,但兩個(gè)概念還是有很大區(qū)別的。
對于Agent和Agentic這兩個(gè)單詞,吳恩達(dá)教授在文章中提到:與其以二元方式選擇某個(gè)系統(tǒng)是否是Agent,不如將系統(tǒng)視為具有不同程度的Agent特性更有用。與名詞“Agent”不同,形容詞“Agentic”允許我們思考這類系統(tǒng),并將它們?nèi)考{入這一不斷發(fā)展的領(lǐng)域中。
原文:Rather than having to choose whether or not something is an agent in a binary way, I thought, it would be more useful to think of systems as being agent-like to different degrees. Unlike the noun “agent,” the adjective “agentic” allows us to contemplate such systems and include all of them in this growing movement.
原文鏈接:
https://www.deeplearning.ai/the-batch/welcoming-diverse-approaches-keeps-machine-learning-strong
也就是說,名詞“Agent”僅用于表明某個(gè)產(chǎn)品或項(xiàng)目是否為AI Agent是否具備了智能特性,而形容詞“Agentic”則意味著AI產(chǎn)品或項(xiàng)目的Agentic特性有多強(qiáng)能否體現(xiàn)更強(qiáng)大主動性、自治性和適應(yīng)性。前者仍在探討Agent產(chǎn)品或項(xiàng)目的相關(guān)特性,后者則在探討產(chǎn)品的智能程度,顯然后者更有意義。
從AI Agent到Agentic AI,即使當(dāng)前所探討的內(nèi)容仍是AI Agent相關(guān)的技術(shù)、產(chǎn)品或解決方案,但立足點(diǎn)已經(jīng)截然不同,這是一個(gè)認(rèn)知上的重大轉(zhuǎn)變。如果說AI Agent仍然屬于產(chǎn)品思維,Agentic AI已經(jīng)上升到戰(zhàn)略思維。Agentic AI進(jìn)一步代表了一類AI技術(shù)、產(chǎn)品、方案、生態(tài)乃至戰(zhàn)略的總體集合,必然也會像GenAI等詞匯一樣被更多的組織放到其戰(zhàn)略報(bào)告之中。
從定義和概念而言,AI Agent是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動作的智能實(shí)體。它們通?;跈C(jī)器學(xué)習(xí)和人工智能技術(shù),具備自主性和自適應(yīng)性,在特定任務(wù)或領(lǐng)域中能夠自主地進(jìn)行學(xué)習(xí)和改進(jìn)。其核心功能可以歸納為三個(gè)步驟的循環(huán):感知、規(guī)劃和行動。
Agentic AI是具有更高程度自主性的AI系統(tǒng),它們能夠主動思考、規(guī)劃和執(zhí)行任務(wù),而不僅僅依賴于預(yù)設(shè)的指令。它強(qiáng)調(diào)的是系統(tǒng)可以具有不同程度的“能動性”(Agentic特性),而不僅僅局限于被動執(zhí)行指令。
兩者的主要區(qū)別,主要在于以下幾點(diǎn):
AI Agent更側(cè)重于智能實(shí)體的基本功能和自主性,而Agentic AI則強(qiáng)調(diào)系統(tǒng)在更高層面上的自主決策和問題解決能力。
AI Agent可以看作是實(shí)現(xiàn)Agentic AI的一種技術(shù)手段或組件,而Agentic AI則是AI Agent在特定工作流程和目標(biāo)導(dǎo)向下的一種表現(xiàn)形式。
Agentic AI的概念更寬泛,涵蓋了從傳統(tǒng)AI系統(tǒng)到高度自主智能體的一系列發(fā)展階段,而AI Agent通常指的是具備一定感知、決策和行動能力的智能實(shí)體。
對于兩者的區(qū)別,我們說了這么多。但當(dāng)探索Agentic AI的時(shí)候,你會發(fā)現(xiàn)更多內(nèi)容仍舊是AI Agent相關(guān)的,或者說是“Agent+工作流”相關(guān)的。吳恩達(dá)教授也提到,Agentic AI的實(shí)現(xiàn)關(guān)鍵在于“智能體工作流(Agentic Workflow)”,它通過循環(huán)迭代的方式逐步優(yōu)化結(jié)果,更接近于人類解決問題的思維模式。
因此,如果說Agentic AI聚焦的是戰(zhàn)略層面指向組織技術(shù)發(fā)展目標(biāo),AI Agent則正是在戰(zhàn)術(shù)層面實(shí)現(xiàn)這個(gè)目標(biāo)的主要方法。
既然涉及到了Agentic Workflow這一概念,這里也來聊一聊。
什么是Agentic Workflow?
自從吳恩達(dá)教授分享了Agentic workflow的四種設(shè)計(jì)方法之后,Agentic workflow變得越發(fā)炙手可熱。雖然這個(gè)概念并不是全新的,但在大語言模型和AI Agent應(yīng)用日益壯大的情況下,Agentic Workflow也正在變得炙手可熱。
匯總各方人士的觀點(diǎn)與看法之后,可以對Agentic Workflow做出以下解釋。
Agentic Workflow可以翻譯為智能體工作流\代理工作流\能動工作流,核心是一個(gè)智能體系統(tǒng),其中多個(gè)AI Agent通過利用自然語言處理 (NLP) 和大型語言模型 (LLM) 協(xié)作完成任務(wù)。這些智能體能夠自主感知、推理和行動,以追求特定目標(biāo),形成強(qiáng)大的集體智慧,可以打破孤島,集成不同的數(shù)據(jù)源,并提供無縫的端到端自動化。
作為一個(gè)復(fù)雜的系統(tǒng)和迭代過程,Agentic Workflow旨在提高業(yè)務(wù)流程的效率和有效性。它使用AI Agent與業(yè)務(wù)設(shè)置無縫集成,部署在Agentic Workflow中的AI Agent能夠高精度地協(xié)作和執(zhí)行復(fù)雜任務(wù)。
Agentic workflow架構(gòu)圖 來源:codiste
從開發(fā)角度而言,Agentic Workflow是指一種迭代、交互式的AI開發(fā)方法,使用大型語言模型和AI Agent來執(zhí)行任務(wù),其中AI Agent能夠參與更動態(tài)和自我反思的過程,這是一種更迭代和多步驟的方法。
從自動化角度來看,Agentic Workflow代表了傳統(tǒng)自動化方法的重大轉(zhuǎn)變。傳統(tǒng)自動化方法通常依賴于嚴(yán)格的預(yù)定義腳本或人機(jī)交互流程,通過利用多個(gè)專業(yè)AI Agent協(xié)同工作的能力,Agentic系統(tǒng)可以動態(tài)導(dǎo)航和適應(yīng)企業(yè)工作流程的復(fù)雜性,因此有望將各行各業(yè)的生產(chǎn)力和創(chuàng)新提升到新的水平。
簡單來說,Agentic Workflow是一個(gè)復(fù)雜的迭代和多步驟過程,用于交互和指示大型語言模型,以更準(zhǔn)確地完成復(fù)雜的任務(wù)。在此過程中,單個(gè)任務(wù)被劃分為多個(gè)更易于管理的小任務(wù),并在整個(gè)任務(wù)完成過程中留出改進(jìn)空間。
此外,Agentic Workflow還涉及部署多個(gè)AI Agent來執(zhí)行特定的角色和任務(wù)。這些Agent配備了特定的個(gè)性和屬性,使他們能夠高精度地協(xié)作和執(zhí)行定義的任務(wù)。
Agentic Workflow的另一個(gè)關(guān)鍵亮點(diǎn)是使用先進(jìn)的提示工程技術(shù)和框架。該過程包括思維鏈、計(jì)劃和自我反思等技術(shù),使AI Agent能夠:
將復(fù)雜的任務(wù)分解為可管理的任務(wù);
確定任務(wù)順序;
遇到困難時(shí)調(diào)整任務(wù)計(jì)劃;
自我反思自己的產(chǎn)出并確定需要改進(jìn)的領(lǐng)域;
提示的工程技術(shù)和多智能體方法使AI Agent能夠自主計(jì)劃、協(xié)作、確定和執(zhí)行完成任務(wù)的必要步驟。
舉個(gè)例子,如果你直接使用LLM寫一篇關(guān)于Agentic AI的文章。在傳統(tǒng)方法中,需要輸入一個(gè)提示,指示LLM 撰寫這個(gè)主題的文章。這就像要求某人從頭到尾寫文章,不審查研究來源、檢查大綱并改善內(nèi)容的語氣和質(zhì)量。
這種傳統(tǒng)的零樣本方法使用LLM,在撰寫文章的過程中沒有留下迭代、反饋和改進(jìn)的余地,大大降低了輸出的準(zhǔn)確性和質(zhì)量。
但在Agentic Workflow并不需要給出撰寫文章的提示,僅需要提出目標(biāo)要求,它就能將任務(wù)分解為更小的任務(wù),一般會有如下的任務(wù)分解步驟:
首先從可靠的來源研究該主題;
創(chuàng)建帶有標(biāo)題和副標(biāo)題的博客大綱;
分析、修改和改進(jìn)大綱;
撰寫博客初稿;
校對和編輯博客以確保高內(nèi)容質(zhì)量
在Agentic Workflow工作模式下,LLM被指示按照一個(gè)循序漸進(jìn)的過程完成更大的任務(wù),且每個(gè)步驟的輸出充當(dāng)下一個(gè)任務(wù)的輸入。
這意味著,Agentic Workflow這種迭代和協(xié)作模型,將與LLM 的交互轉(zhuǎn)換為一系列可管理、可改進(jìn)的步驟,從而允許在整個(gè)任務(wù)完成過程中進(jìn)行持續(xù)改進(jìn)和調(diào)整。
Agentic Workflow的主要特征與三大支柱
通過以上解析和案例,我們可以總結(jié)Agentic Workflow的主要特征如下:
以目標(biāo)為導(dǎo)向:工作流中的座席由明確的目標(biāo)驅(qū)動,并共同努力實(shí)現(xiàn)預(yù)期的結(jié)果。
適應(yīng)性:該系統(tǒng)可以動態(tài)地適應(yīng)不斷變化的環(huán)境,從過去的經(jīng)驗(yàn)中學(xué)習(xí),并隨著時(shí)間的推移優(yōu)化其性能。
互動:座席相互通信和協(xié)作,以及與人類用戶進(jìn)行通信和協(xié)作,以收集信息、提供更新并做出決策。
與傳統(tǒng)工作流自動化相比,Agentic Workflow具有多種優(yōu)勢。它們可以處理更復(fù)雜的多步驟流程,這些流程需要上下文感知決策,并且可以適應(yīng)新情況,而無需大量重新編程。此外,自然語言處理的使用允許人與系統(tǒng)之間更直觀地交互,從而減少對專業(yè)技術(shù)知識的需求。
在Agentic Workflow中,AI Agent是一個(gè)自主驅(qū)動的動態(tài)問題解決器,用于處理復(fù)雜且不斷發(fā)展的任務(wù),從而提高工作效率。
AI Agents、提示工程技術(shù)(Prompt Engineering Techniques)和生成式AI網(wǎng)絡(luò)(Generative AI Networks,GAIN) 是Agentic Workflow的三大支柱。它們在Agentic Workflow中的作用,簡單介紹如下:
AI Agent:Agentic Workflow的核心是AI Agent,它們本質(zhì)上是大型語言模型(LLMs)的復(fù)雜實(shí)例。
提示工程技術(shù)與框架:Agentic Workflow的一個(gè)關(guān)鍵方面是使用高級提示工程技術(shù)和框架。
生成式AI網(wǎng)絡(luò)(GAINs):通過部署生成式AI網(wǎng)絡(luò)(GAINs),Agentic Workflow得到顯著增強(qiáng),它們體現(xiàn)了多代理協(xié)作的原則。
三大支柱的詳細(xì)內(nèi)容,可以參考下面的思維導(dǎo)圖。
▲ 點(diǎn)擊看大圖
除了三大支柱,Agentic Workflow的核心組成部分還包括AI增強(qiáng)、倫理考量、人工智能交互和適應(yīng)性學(xué)習(xí),各項(xiàng)解析如下圖。
此外,關(guān)于Agentic Workflow的常見工作流程及可重用的LLM配置文件組件,大家可以參考論文:A Survey on LLM-Based Agents: Common Workflows and Reusable LLM-Profiled Components.
論文地址:
https://arxiv.org/abs/2406.05804
各種工作的業(yè)務(wù)流程從傳統(tǒng)流程轉(zhuǎn)向Agentic Workflow,標(biāo)志著我們將能夠通過AI實(shí)現(xiàn)更優(yōu)越成果的轉(zhuǎn)變。實(shí)驗(yàn)證明,即便是不太先進(jìn)的LLMs,參與這些復(fù)雜的、多層次的工作流程時(shí),也能產(chǎn)生顯著的成果。對于這一點(diǎn),大家將在下面對Agentic Workflow的四種設(shè)計(jì)模式的介紹中有更深的感觸。
多說一句,Agentic Workflow也讓國產(chǎn)大語言模型和各種開源大語言模型擁有了更多用武之地,這在當(dāng)前的國際大環(huán)境下還是非常重要的。
當(dāng)然,我們還應(yīng)該認(rèn)識到,在目前的技術(shù)前提下,這些增強(qiáng)的工作流程要求用戶有足夠的耐心。因?yàn)锳gentic Workflow固有的迭代、協(xié)作過程也更加耗時(shí),往往需要幾分鐘甚至幾小時(shí)來完成某個(gè)任務(wù)。過長的任務(wù)執(zhí)行時(shí)間,也是Agentic Workflow遇到的主要問題之一,更是被吐槽體驗(yàn)不夠的重要因素。
但相對于它能提供的遠(yuǎn)超過傳統(tǒng)方法的分析深度、創(chuàng)造力和解決問題的能力,在很多應(yīng)用場景中大家仍然愿意嘗試,這也預(yù)示著巨大的市場潛力。
Agentic Workflow的四種主流設(shè)計(jì)模式
在介紹Agentic Workflow之前,先考慮一個(gè)問題,為什么需要AI Agent/Agentic Workflow?
目前,對于ChatGPT、文心一言、Kimi等大語言模型的使用,大多數(shù)人仍然是用簡單的語句直接提問(一部分原因在于不會寫結(jié)構(gòu)化提示詞),比如:幫我寫一篇關(guān)于Agentic AI的文章。這種提問方式,在技術(shù)領(lǐng)域叫作零樣本提示。
零樣本提示(zero-shot prompting)是指LLM模型在沒有針對具體任務(wù)進(jìn)行專門訓(xùn)練的情況下,僅依賴于提示詞(prompt)和預(yù)訓(xùn)練中獲得的廣泛語言知識來執(zhí)行任務(wù)的能力,它可以很好地檢驗(yàn)大語言模型的能力。這種方法靈活性高、適用范圍廣,且無需為每個(gè)特定任務(wù)準(zhǔn)備專門的訓(xùn)練數(shù)據(jù)。但由于缺乏特定任務(wù)的訓(xùn)練,其生成質(zhì)量無法保證。
具體到用戶與大語言模型的交互,如果用戶讓ChatGPT寫一篇關(guān)于XX的論文,ChatGPT會一次性給出回復(fù)。在這個(gè)過程中,它只會執(zhí)行“生成”這個(gè)任務(wù)。
這個(gè)過程,與真實(shí)世界完成工作任務(wù)的流程是不同的。比如寫論文時(shí),一般會先起草一個(gè)初稿,再進(jìn)行評估、分析、修訂,迭代出第二、第三個(gè)版本,直到滿意為止。我們處理工作、學(xué)習(xí)等任務(wù)時(shí)都是這樣,會將其分解為按步執(zhí)行的流程并按照流程來操作,以保證工作的完成的質(zhì)量。
▲ 零樣本提示與Agentic Workflow的區(qū)別 來源:吳恩達(dá)教授紅杉峰會分享
也就是說,想要讓大語言模型更出色的完成我們的交給它的工作,最好也使用類似人類的分部執(zhí)行的流程步驟。
AI Agent就是來做這個(gè)工作的,它能通過自然語言了解用戶所輸入零樣本提示詞的意圖,并將這個(gè)用戶給定的需求目標(biāo)任務(wù)規(guī)劃分解為多個(gè)流程步驟,將簡單的提示詞轉(zhuǎn)化為更精細(xì)的機(jī)構(gòu)化提示詞,并可以調(diào)用聯(lián)網(wǎng)、代碼等各種工具插件去進(jìn)一步執(zhí)行并完成所分解的各種子任務(wù)。
顯然,這樣的工作方式已經(jīng)無限接近于人類。
Zero-shot prompting模式和AI Agent模式的任務(wù)執(zhí)行效果,非常明顯。吳恩達(dá)教授團(tuán)隊(duì)分別以“Zero-shot prompting”模式和AI Agent模式使用GPT-3.5和GPT-4,得出了幾個(gè)結(jié)論:
1、Zero-shot模式下,模型在沒有具體任務(wù)示例的情況下,僅依賴于其預(yù)訓(xùn)練的知識來執(zhí)行任務(wù)。這種情況下比拼的是模型的通用基礎(chǔ)能力,所以GPT-4得表現(xiàn)好在意料之中。
2、添加了Agentic Workflow的AI Agent在任務(wù)執(zhí)行中的表現(xiàn)顯著提升,不論基座模型是GPT-3.5還是GPT-4。
3、即使基座模型是GPT-3.5,通過添加Agentic Workflow將其設(shè)計(jì)為AI Agent后,性能表現(xiàn)也超過了Zero-shot模式下的GPT-4。
吳恩達(dá)教授還總結(jié)和介紹了四種較為常見的設(shè)計(jì)模式,分別是反饋(Reflection)、工具使用(Tool Use)、規(guī)劃(Planning)和多智能體協(xié)作(Multi-agent Collaboration)。
反饋(Reflection)設(shè)計(jì)模式是一種讓AI模型通過自我反思和迭代改進(jìn)來提高任務(wù)執(zhí)行能力的方法。在這種模式中,模型不僅生成初始解決方案,還會通過多次反饋和修改,不斷優(yōu)化其輸出。
工具使用(Tool Use)設(shè)計(jì)模式是一種讓AI模型通過調(diào)用外部工具或庫來增強(qiáng)任務(wù)執(zhí)行能力的方法。在這種模式中,模型并不僅僅依賴于自身的知識和能力,而是利用各種外部資源來完成任務(wù),從而提高效率和準(zhǔn)確性。
規(guī)劃(Planning)設(shè)計(jì)模式是一種通過提前計(jì)劃和組織任務(wù)步驟來提高效率和準(zhǔn)確性的方法。在這種模式中,模型將復(fù)雜任務(wù)分解為多個(gè)步驟,并依次執(zhí)行每個(gè)步驟,以達(dá)到預(yù)期的目標(biāo)。
多智能體協(xié)作(Multiagent Collaboration)設(shè)計(jì)模式是一種通過多個(gè)智能體之間的合作來提高任務(wù)執(zhí)行效率和準(zhǔn)確性的方法。在這種模式中,多個(gè)智能體分擔(dān)任務(wù),并通過相互交流和協(xié)作,共同完成復(fù)雜任務(wù)。
PS:以上標(biāo)有 Andrew Ng的圖片,都來自吳恩達(dá)教授紅杉峰會分享。公眾號后臺發(fā)消息 agentic ,獲取 吳恩達(dá)紅杉美國AI峰會談 Agentic Workflow 以及 4 種主流設(shè)計(jì)模式的PDF文件。
AI Agent/Agentic Workflow可以更好幫助用戶與大語言模型交互,幫助用戶更好的完成各種任務(wù)。這將極大地拓展AI的使用場景,有效地提高任務(wù)完成質(zhì)量,因此對AI應(yīng)用的落地至關(guān)重要。
在這個(gè)分享中,吳恩達(dá)教授將Agent參與的流程稱作Agentic Workflow,而不是AI Agent workflow,顯然后者更注重AI Agent參與的workflow而不是AI Agent本身。從這一點(diǎn),也能看出AI Agent與 Agentic AI的簡單區(qū)別。
對于AI Agent參與的業(yè)務(wù)流程自動化,RPA\超自動化、ERP、CRM、BI等技術(shù)廠商早已在現(xiàn)有技術(shù)生態(tài)下引入了AI Agent架構(gòu),且表現(xiàn)出的任務(wù)執(zhí)行能力更強(qiáng)。對于這個(gè)選題,王吉偉頻道會在另一篇文章中與大家交流。
Agentic AI的概念已經(jīng)講清楚,而后面要實(shí)現(xiàn)這個(gè)目標(biāo)并使其繁榮,就要看各種AI Agent的構(gòu)建方式以及各種融合AI Agent的Agentic Workflow解決方案了。
在Agentic Workflow的構(gòu)建方面,吳恩達(dá)教授給出的四種主流設(shè)計(jì)模式,已經(jīng)給于開發(fā)者及企業(yè)很大啟發(fā)。
目前很多AI Agent構(gòu)建平臺已經(jīng)支持這四種設(shè)計(jì)模式,企業(yè)及個(gè)人都已能在這些平臺構(gòu)建符合需求Agentic Workflow。還有很多開源項(xiàng)目也在進(jìn)一步優(yōu)化Agentic workflow的構(gòu)建流程,對于廣大組織的私有化部署都是極大的利好。
此外很多技術(shù)供應(yīng)商也已在引入AI Agent的基礎(chǔ)上進(jìn)一步構(gòu)建Agentic Workflow,能夠讓用戶更簡單快捷的應(yīng)用各種智能工作流。
在Agentic Workflow構(gòu)建上,王吉偉頻道也會在后面寫幾篇文章與大家分享相關(guān)的體驗(yàn)感受。大家想在哪些方面進(jìn)行交流,歡迎踴躍留言。
后記:握住Agentic AI的商業(yè)脈搏
當(dāng)前AI應(yīng)用有一個(gè)大趨勢,幾乎所有應(yīng)用都在向AI Agent和RAG的方向發(fā)展與遷移。這意味著,如果所有的AI應(yīng)用都走向AI Agent模式,未來的workflow都將變成Agentic Workflow。
從吳恩達(dá)教授的Zero-shot prompting與Agentic Workflow來看,任何加持了Agentic模式的大語言模型都能領(lǐng)先大模型本身很多,這意味著接下來組織與企業(yè)的業(yè)務(wù)流程效率將會翻倍提升。
在王吉偉頻道看來,即使ChatGPT背后的大語言模型迭代到GPT-4以后的更高版本,Agentic AI也會是更高效的大語言模型使用方式。不然,OpenAI也不會發(fā)表本文開頭所提到的白皮書,來詳細(xì)闡述大語言模型、AI Agent與Agentic AI Systerm的關(guān)聯(lián)與區(qū)別了。
通過各種系統(tǒng)與集成大語言模型,或者在大語言模型的基礎(chǔ)上做工具與平臺擴(kuò)展,對于大語言模型的應(yīng)用效率及體驗(yàn)會更高,已是被驗(yàn)證的事實(shí)。
拓展閱讀:更多組織接入ChatGPT等生成式AI,生成式自動化或成企業(yè)運(yùn)營新標(biāo)配
從AI技術(shù)發(fā)展歷史來看,智能體的理念要先于AI,且一直以來AI都是作為Agent的技術(shù)實(shí)現(xiàn)路徑,大語言模型亦不例外。因此在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)火爆以后,大家都在關(guān)注的是AlphaGo和AI換臉技術(shù)?,F(xiàn)在大語言模型火了,人們關(guān)注更多的也是AI Agent、Agentic Workflow以及接下來的Agentic AI。
拓展閱讀:AI Agent發(fā)展簡史,從哲學(xué)思想啟蒙到人工智能實(shí)體落地
當(dāng)然,Agentic AI也不是玄之又玄的東西,只是把AI Agent以及Agentic Workflow在內(nèi)的各種應(yīng)用與生態(tài)歸納成了一類。但不可否認(rèn)的是,它勢必會在未來很長一段時(shí)間內(nèi)成為各大組織與商業(yè)領(lǐng)域的口頭禪,也會成為這一階段AI的重要體現(xiàn)形式。
當(dāng)下,全民皆談智能體讓AI Agent越發(fā)審美疲勞,國外更多則在談Agentic AI。就連吳恩達(dá)教授也在文章中提到:當(dāng)看到一篇談?wù)?ldquo;Agentic”工作流程的文章時(shí),更有可能閱讀。
大家的眼球開始被Agentic AI吸引,是否還會足夠關(guān)注AI Agent?這是否意味著AI Agent已然勢微?對于這些問題,大家不要忘了前面我們的探討:AI Agent是Agentic AI的實(shí)現(xiàn)方式,Agentic Workflow是Agentic AI的關(guān)鍵。
所以,從“道”的層面關(guān)注Agentic AI戰(zhàn)略發(fā)展趨勢,從術(shù)的層面關(guān)注AI Agent不斷推陳出新的各種框架、技術(shù)與解決方案,你將會把握住整個(gè)Agentic AI乃至AGI時(shí)代的商業(yè)脈搏。
全文完
【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動化與RPA,歡迎關(guān)注與交流?!?/p>
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
我不是危言聳聽,現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說:誰能把MCP做起來,誰就擁有AI生態(tài)控制權(quán),誰就是AI圈的老大。你們有沒有發(fā)現(xiàn),MCP在2025年初開始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個(gè)MCP平臺,提供50+預(yù)置MCP服務(wù)。不過大都只面向阿里系產(chǎn)品。(2)騰
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會理事長李軍接受了大賽主持人艾誠采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場“冠軍中的冠軍”對決,更是一次全球AI人才的線下交流盛會。大賽“史無前例”的吸引了全球青年科技精英匯聚香港,更加推動和普
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠采訪。裁判委員會主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林
2025國際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學(xué)工程學(xué)院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵(lì)年輕人要像懂中文和英語一樣懂AI,
昨天新出了一個(gè)AI,據(jù)說比DeepSeek還牛,而截止到今早,已經(jīng)有10萬人在排隊(duì)申請Manus邀請碼了,而且它邀請碼已經(jīng)炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛
蘋果16弄了兩個(gè)版本,一個(gè)是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個(gè)是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點(diǎn)。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇?jì)算機(jī)之父約翰·馮·諾依曼曾這樣說到。