智能體(Agent)定義AI智能體,又稱AI代理或 Al Agent,是能夠感知環(huán)境,基于目標(biāo)進(jìn)行決策并執(zhí)行動(dòng)作的智能化應(yīng)用。它具備自主性、交互性、反應(yīng)性和適應(yīng)性等基本特征,能夠在復(fù)雜多變的環(huán)境中獨(dú)立完成任務(wù)。智能體的出現(xiàn),標(biāo)志著人工智能從簡單的規(guī)則匹配和計(jì)算模擬向更高級(jí)別的自主智能邁進(jìn)。 ![]() Al Agent 具備三個(gè)核心能力:獨(dú)立思考、自主執(zhí)行、持續(xù)迭代。
Agent 銜接模型層與應(yīng)?層,是現(xiàn)階段?模型應(yīng)?落地的重要補(bǔ)充智能體,在眾多中間層中,處于中心位置,可以封裝模型微調(diào)、提示工程、檢索增強(qiáng)生成。隨著底層模型技術(shù)的持續(xù)進(jìn)步與演化,未來可能會(huì)出現(xiàn)模型層逐漸內(nèi)化并泛化出原本由中間層提供的部分能力。 ![]() 智能體落地框架由大模型驅(qū)動(dòng)的 Al Agent 架構(gòu)是當(dāng)前比較常見的 Al Agent 落地架構(gòu),包含規(guī)劃(Planning)、記憶(Memory)、工具(Tools)、執(zhí)行(Action)四大要素。 ![]() 大模型AI Agent= LLM *(規(guī)劃+記憶+工具+執(zhí)行)
智能體工作流程AIAgent 在企業(yè)用戶的運(yùn)行流程分成問題澄清、分析拆解、智能決策、任務(wù)執(zhí)行、觀察結(jié)果、記憶存儲(chǔ)等步驟。當(dāng)前實(shí)際應(yīng)用落地場(chǎng)景主要是問題澄清、分析拆解、智能決策、任務(wù)執(zhí)行,少部分場(chǎng)景會(huì)涉及到觀察結(jié)果和記憶存儲(chǔ)。 ![]()
觀察結(jié)果和記憶存儲(chǔ)是 AlAgent 未來能夠發(fā)揮重要價(jià)值的關(guān)鍵。大模型泛化能力讓 AIAgent 能夠以極低成本持續(xù)迭代,通過持續(xù)積累案例,提升 AlAgent 的能力 智能體現(xiàn)狀現(xiàn)階段的智能體應(yīng)用,仍未長出足夠的自主思考能力以應(yīng)對(duì)復(fù)雜場(chǎng)景。目前仍舊處于AI Agent的初期階段,各種智能體產(chǎn)品距離真正的自主智能還有很遠(yuǎn)的路要走。 ![]() 產(chǎn)品發(fā)展早期階段,四大類廠商各顯神通InfoQ研究中心在對(duì)市面上對(duì)外服務(wù)的 Al Agent 產(chǎn)品進(jìn)行研究后,發(fā)現(xiàn)其背景主要分為大模型創(chuàng)業(yè)廠商、互聯(lián)網(wǎng)科技廠商、RPA/流程自動(dòng)化廠商和數(shù)字化企業(yè)服務(wù)商。 ![]() 多種Agent構(gòu)建方式滿足不同技術(shù)水平、不同場(chǎng)景的用戶需求在構(gòu)建和使用方式上,AI Agent 產(chǎn)品均支持根據(jù)內(nèi)置模版構(gòu)建、復(fù)雜智能體構(gòu)建和代碼構(gòu)建三種基礎(chǔ)構(gòu)建方式以滿足不同技術(shù)水平的用戶需求。此外,雖然大多數(shù)產(chǎn)品支持自然語言一鍵構(gòu)建方式,但受限于現(xiàn)有大腦的任務(wù)拆解和規(guī)劃能力,仍可以視為一種“面向未來”的構(gòu)建方式。 ![]() 平臺(tái)類Agent:工具數(shù)量和類型不足,工具生態(tài)正在構(gòu)建初期技術(shù)框架中的工具在平臺(tái)類Agent產(chǎn)品存在多種叫法:插件、組件等,但其本質(zhì)都是將大模型「大腦」的思考轉(zhuǎn)化為具體行動(dòng)和執(zhí)行的重要橋梁。目前支持的工具類型包含信息檢索、文件讀取等,數(shù)量和類型覆蓋范圍不夠廣,仍處在工具生態(tài)建設(shè)初期。 ![]() 場(chǎng)景示例:智譜GLM智能體應(yīng)用布局智譜智能體開發(fā)平臺(tái),借助領(lǐng)先的智譜大模型技術(shù),用靈活編排 AI 工作流、自主調(diào)用企業(yè)定義的數(shù)據(jù)知識(shí)和工具,快速構(gòu)建專業(yè)級(jí)智能體。同時(shí),智譜AutoGLM正式發(fā)布Agent家族,包括AutoGLM、AutoGLM-Web、GLM-PC三個(gè)版本 ,對(duì)應(yīng)手機(jī)、瀏覽器、電腦三種終端應(yīng)用場(chǎng)景。 ![]() 智能體開發(fā)平臺(tái)示例如下: ![]() AutoGLM示例如下: ![]() AutoGLM-Web示例如下: ![]() GLM- PC示例如下: ![]() 實(shí)在智能體示例如下: ![]() 泛微智能大腦智能體示例如下: ![]() |
|