亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

萬(wàn)字長(zhǎng)文AI智能體:17種體架構(gòu)詳細(xì)實(shí)現(xiàn)

穎脈Imgtec ? 2025-11-07 13:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文轉(zhuǎn)自:Coggle數(shù)據(jù)科學(xué)


AI 智能體領(lǐng)域發(fā)展迅猛,但許多資源仍然過(guò)于抽象和理論化。創(chuàng)建此項(xiàng)目的目的是為開(kāi)發(fā)者、研究人員和AI愛(ài)好者提供一條結(jié)構(gòu)化、實(shí)用且深入的學(xué)習(xí)路徑,以掌握構(gòu)建智能系統(tǒng)的藝術(shù)。

https://github.com/FareedKhan-dev/all-agentic-architectures

從理論到實(shí)際代碼:每種架構(gòu)不僅有解釋,而且都在可運(yùn)行的Jupyter Notebook中進(jìn)行了端到端的實(shí)現(xiàn)。

結(jié)構(gòu)化學(xué)習(xí)路徑:Notebooks 的順序經(jīng)過(guò)精心編排,循序漸進(jìn)地構(gòu)建概念,從基礎(chǔ)模式到高度先進(jìn)、多智能體和自我意識(shí)系統(tǒng)。

真實(shí)世界場(chǎng)景:示例都基于實(shí)際應(yīng)用——金融分析、編程、社交媒體管理、醫(yī)療分診等,使概念立即可用。

第 1 部分:基礎(chǔ)模式 (Notebooks 1-4)

涵蓋增強(qiáng)單個(gè)智能體的基本構(gòu)建塊:Reflection(反思)、Tool Use(工具使用)、ReAct(推理/行動(dòng)循環(huán))和 Planning(規(guī)劃)。

第 2 部分:多智能體協(xié)作 (Notebooks 5, 7, 11, 13)

探索智能體如何協(xié)同工作:Multi-Agent Systems(多智能體團(tuán)隊(duì))、Meta-Controller(智能路由器)、Blackboard Systems(共享內(nèi)存協(xié)作)和 Ensemble(并行多樣化分析)。

第 3 部分:高級(jí)記憶與推理 (Notebooks 8, 9, 12)

專注于智能體如何進(jìn)行更深入的思考和記憶:Episodic + Semantic Memory(雙重記憶系統(tǒng))、Graph World-Model(圖結(jié)構(gòu)化知識(shí)推理)和 Tree of Thoughts(系統(tǒng)化多路徑探索)。

第 4 部分:安全性、可靠性和真實(shí)世界交互 (Notebooks 6, 10, 14, 17)

構(gòu)建可在生產(chǎn)環(huán)境中信任的智能體:Dry-Run Harness(安全模擬/人工審批)、Simulator(行動(dòng)前模擬)、PEV(規(guī)劃、執(zhí)行、驗(yàn)證的錯(cuò)誤恢復(fù))和 Metacognitive(理解自身局限性)。

第 5 部分:學(xué)習(xí)與適應(yīng) (Notebooks 15, 16)

探索智能體如何隨時(shí)間改進(jìn)和以新穎方式解決問(wèn)題:Self-Improvement Loop(自我改進(jìn)/類RLHF學(xué)習(xí))和 Cellular Automata(元胞自動(dòng)機(jī),簡(jiǎn)單規(guī)則產(chǎn)生復(fù)雜全局行為)。


智能體架構(gòu) 1:反思 (Reflection)

反思模式將大型語(yǔ)言模型(LLM)從一個(gè)簡(jiǎn)單的、單次通過(guò)的生成器提升為一個(gè)更審慎、更可靠的推理器。它模仿了人類“起草、審閱、編輯”的過(guò)程,讓智能體在返回最終答案之前,先退一步批評(píng)、分析和完善自己的工作。

d86ce642-bb98-11f0-8ce9-92fbcf53809c.png

定義:反思架構(gòu)涉及智能體在返回最終答案之前,批評(píng)和修訂自己的輸出。它從單次生成轉(zhuǎn)變?yōu)橐粋€(gè)多步驟的內(nèi)部獨(dú)白:生產(chǎn)(Produce)、評(píng)估(Evaluate)和改進(jìn)(Improve)。

高層工作流:

  1. 生成 (Generate):智能體根據(jù)用戶提示生成初始草稿或解決方案。
  2. 批評(píng) (Critique):智能體切換角色為批評(píng)者,進(jìn)行自我提問(wèn),例如:“這個(gè)答案有什么問(wèn)題?”、“是否最優(yōu)?”、“有沒(méi)有邏輯錯(cuò)誤或 Bug?”
  3. 完善 (Refine):利用自我批評(píng)的見(jiàn)解,智能體生成最終的、改進(jìn)后的版本。

方面

描述

何時(shí)使用

代碼生成:充當(dāng)代碼審閱者,修正 Bug 和提高效率。
復(fù)雜總結(jié):確??偨Y(jié)全面準(zhǔn)確,沒(méi)有遺漏關(guān)鍵細(xì)節(jié)。
內(nèi)容創(chuàng)作:優(yōu)化語(yǔ)氣、清晰度和影響力。

優(yōu)勢(shì) (Strengths)

質(zhì)量提升:直接解決和糾正錯(cuò)誤,輸出更準(zhǔn)確、可靠。
低開(kāi)銷:概念簡(jiǎn)單,只需單個(gè) LLM 即可實(shí)現(xiàn),無(wú)需復(fù)雜的外部工具。

劣勢(shì) (Weaknesses)

自我局限:智能體仍受限于自身知識(shí)和偏見(jiàn),無(wú)法憑空創(chuàng)造它所缺乏的知識(shí)。
延遲與成本增加:至少涉及兩次 LLM 調(diào)用(生成 + 批評(píng)/完善),比單次通過(guò)更慢、更昂貴。



智能體架構(gòu) 2:工具使用 (Tool Use)

工具使用架構(gòu)是連接大型語(yǔ)言模型(LLM)推理能力與真實(shí)、動(dòng)態(tài)世界的橋梁。它賦予智能體查詢 API、搜索數(shù)據(jù)庫(kù)和訪問(wèn)實(shí)時(shí)信息的能力,從而克服了 LLM 知識(shí)的靜態(tài)局限性。

d88abd02-bb98-11f0-8ce9-92fbcf53809c.jpg

定義:工具使用架構(gòu)為 LLM 驅(qū)動(dòng)的智能體配備了調(diào)用外部函數(shù)或 API(即“工具”)的能力。智能體能夠自主判斷用戶查詢是否需要外部信息,并決定調(diào)用哪個(gè)工具來(lái)獲取所需數(shù)據(jù)。

高層工作流:

  1. 接收查詢 (Receive Query):智能體接收用戶的請(qǐng)求。
  2. 決策 (Decision):智能體分析查詢和可用工具,判斷是否需要工具。
  3. 行動(dòng) (Action):如果需要,智能體格式化對(duì)工具的調(diào)用(例如,帶正確參數(shù)的特定函數(shù))。
  4. 觀察 (Observation):系統(tǒng)執(zhí)行工具調(diào)用,并將結(jié)果(“觀察結(jié)果”)返回給智能體。
  5. 合成 (Synthesis):智能體將工具的輸出整合到其推理過(guò)程中,生成一個(gè)最終的、有事實(shí)依據(jù)的答案。

方面

描述

何時(shí)使用

研究助理:使用網(wǎng)絡(luò)搜索 API 回答需要最新信息的查詢。
企業(yè)助理:查詢內(nèi)部數(shù)據(jù)庫(kù)以獲取實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)。
科學(xué)計(jì)算:使用計(jì)算引擎進(jìn)行 LLM 難以精確處理的數(shù)學(xué)和科學(xué)計(jì)算。

優(yōu)勢(shì) (Strengths)

事實(shí)依據(jù) (Factual Grounding):通過(guò)獲取實(shí)時(shí)數(shù)據(jù),顯著減少幻覺(jué) (Hallucinations)。
可擴(kuò)展性 (Extensibility):智能體的能力可以簡(jiǎn)單地通過(guò)添加新工具持續(xù)擴(kuò)展。

劣勢(shì) (Weaknesses)

集成開(kāi)銷 (Integration Overhead):需要仔細(xì)定義工具、管理 API 密鑰和處理潛在的工具調(diào)用失敗。
工具信任 (Tool Trust):最終答案的質(zhì)量取決于所使用工具的可靠性和準(zhǔn)確性。



智能體架構(gòu) 3:ReAct (Reason + Act)

ReAct (Reason + Act,即“推理 + 行動(dòng)”)是一種關(guān)鍵的智能體架構(gòu),它彌合了簡(jiǎn)單的工具使用和復(fù)雜的、多步驟問(wèn)題解決之間的差距。它的核心創(chuàng)新在于允許智能體動(dòng)態(tài)地交錯(cuò)推理和行動(dòng),從而成為一個(gè)自適應(yīng)的問(wèn)題解決者。

定義:ReAct 架構(gòu)是一種設(shè)計(jì)模式,智能體在其中交替進(jìn)行推理步驟和行動(dòng)。智能體不是預(yù)先規(guī)劃所有步驟,而是生成關(guān)于其下一步行動(dòng)的內(nèi)部思考,然后執(zhí)行一個(gè)行動(dòng)(如調(diào)用工具),觀察結(jié)果,并利用新信息生成下一個(gè)思考和行動(dòng)。這創(chuàng)建了一個(gè)動(dòng)態(tài)和自適應(yīng)的循環(huán)。

高層工作流:

  1. 接收目標(biāo) (Receive Goal):智能體接收一項(xiàng)復(fù)雜的任務(wù)。
  2. 思考 (Think / Reason):智能體生成一個(gè)內(nèi)部思考,例如:“為了回答這個(gè)問(wèn)題,我首先需要找到信息 X。”
  3. 行動(dòng) (Act):根據(jù)思考,智能體執(zhí)行一個(gè)行動(dòng),通常是調(diào)用工具(例如:search_api('X'))。
  4. 觀察 (Observe):智能體接收到工具返回的結(jié)果。
  5. 重復(fù) (Repeat):智能體將觀察結(jié)果納入其上下文,返回第 2 步,生成一個(gè)新的思考(例如:“好的,既然我有了 X,我現(xiàn)在需要用它來(lái)找到 Y?!保?。這個(gè)循環(huán)持續(xù)進(jìn)行,直到總體目標(biāo)達(dá)成。

方面

描述

何時(shí)使用

多跳問(wèn)答 (Multi-hop Q&A):回答需要按順序查找多個(gè)信息的查詢(例如:“制造 iPhone 的公司現(xiàn)任 CEO 是誰(shuí)?”)。
網(wǎng)絡(luò)導(dǎo)航與研究:智能體根據(jù)上一步的搜索結(jié)果動(dòng)態(tài)調(diào)整下一搜索詞。
交互式工作流:任何無(wú)法預(yù)先知道完整解決路徑、環(huán)境動(dòng)態(tài)變化的復(fù)雜任務(wù)。

優(yōu)勢(shì) (Strengths)

自適應(yīng)和動(dòng)態(tài):可以根據(jù)新信息即時(shí)調(diào)整其計(jì)劃。
處理復(fù)雜性:擅長(zhǎng)需要鏈接多個(gè)依賴步驟的問(wèn)題。

劣勢(shì) (Weaknesses)

更高的延遲與成本:涉及多個(gè)順序的 LLM 調(diào)用,比單次通過(guò)方法更慢、更昂貴。
循環(huán)風(fēng)險(xiǎn):引導(dǎo)不當(dāng)?shù)闹悄荏w可能會(huì)陷入重復(fù)、低效的思考和行動(dòng)循環(huán)中。



智能體架構(gòu) 4:規(guī)劃 (Planning)

規(guī)劃 (Planning)架構(gòu)在智能體的推理過(guò)程中引入了至關(guān)重要的 **預(yù)見(jiàn)性 (foresight)**。與 ReAct 模式(步步為營(yíng)、即時(shí)反應(yīng))不同,規(guī)劃智能體在采取任何行動(dòng)之前,會(huì)先將一個(gè)復(fù)雜的任務(wù)分解成一系列更小、可管理的子目標(biāo),制定一個(gè)完整的“作戰(zhàn)計(jì)劃”。

d8a387b0-bb98-11f0-8ce9-92fbcf53809c.jpg

定義:規(guī)劃架構(gòu)涉及智能體在開(kāi)始執(zhí)行之前,將復(fù)雜的總目標(biāo)明確分解為一個(gè)詳細(xì)的、按順序排列的子任務(wù)列表。初始規(guī)劃階段的輸出是一個(gè)具體的、循序漸進(jìn)的計(jì)劃,智能體隨后將有條不紊地遵循該計(jì)劃來(lái)解決問(wèn)題。

高層工作流:

  1. 接收目標(biāo) (Receive Goal):智能體接收一個(gè)復(fù)雜任務(wù)。
  2. 規(guī)劃 (Plan):專門(mén)的“規(guī)劃器 (Planner)”組件分析目標(biāo),并生成一個(gè)有序的子任務(wù)列表,例如:["查找事實(shí) A", "查找事實(shí) B", "使用 A 和 B 計(jì)算 C"]
  3. 執(zhí)行 (Execute):一個(gè)“執(zhí)行器 (Executor)”組件按照計(jì)劃,順序執(zhí)行每個(gè)子任務(wù),并根據(jù)需要使用工具。
  4. 合成 (Synthesize):一旦計(jì)劃中的所有步驟都完成,一個(gè)最終組件會(huì)整合執(zhí)行步驟的結(jié)果,生成一個(gè)連貫的最終答案。

方面

描述

何時(shí)使用

多步驟工作流:適用于操作順序已知且關(guān)鍵的任務(wù),如生成報(bào)告(獲取數(shù)據(jù)處理總結(jié))。
項(xiàng)目管理:將“發(fā)布新功能”等大型目標(biāo)分解為各團(tuán)隊(duì)的子任務(wù)。
教學(xué)輔導(dǎo):制定教學(xué)計(jì)劃,從基礎(chǔ)到應(yīng)用教授特定概念。

優(yōu)勢(shì) (Strengths)

結(jié)構(gòu)化和可追溯:整個(gè)工作流程預(yù)先設(shè)定,過(guò)程透明,易于調(diào)試。
高效:對(duì)于可預(yù)測(cè)的任務(wù),可以避免 ReAct 在每一步之間進(jìn)行額外的推理循環(huán),從而提高效率。

劣勢(shì) (Weaknesses)

對(duì)變化脆弱 (Brittle to Change):如果環(huán)境在執(zhí)行過(guò)程中發(fā)生意外變化,預(yù)先制定的計(jì)劃可能會(huì)失敗。它不如 ReAct 智能體那樣具有自適應(yīng)性。



智能體架構(gòu) 5:多智能體系統(tǒng) (Multi-Agent Systems)

多智能體系統(tǒng) (Multi-Agent System, MAS)是最強(qiáng)大和靈活的架構(gòu)之一。它超越了單個(gè)智能體的概念,轉(zhuǎn)而模擬一個(gè)由專業(yè)化智能體組成的團(tuán)隊(duì),通過(guò)協(xié)作來(lái)解決問(wèn)題。每個(gè)智能體都有獨(dú)特的角色、個(gè)性和技能集,模仿了人類專家團(tuán)隊(duì)的工作方式。

定義:多智能體系統(tǒng)是一種架構(gòu),其中一組截然不同、高度專業(yè)的智能體通過(guò)協(xié)作(有時(shí)是競(jìng)爭(zhēng))來(lái)實(shí)現(xiàn)一個(gè)共同目標(biāo)。系統(tǒng)使用一個(gè)中央控制器或定義的工作流協(xié)議來(lái)管理智能體之間的通信和任務(wù)路由。

高層工作流:

  1. 分解 (Decomposition):主控制器或用戶提供一個(gè)復(fù)雜的任務(wù)。
  2. 角色定義 (Role Definition):系統(tǒng)根據(jù)智能體的定義角色(例如:‘研究員’、‘編碼員’、‘評(píng)論家’、‘作家’)將子任務(wù)分配給專業(yè)的智能體。
  3. 協(xié)作 (Collaboration):智能體執(zhí)行各自的任務(wù),通常是并行或順序進(jìn)行。它們將輸出傳遞給彼此或一個(gè)中心“黑板”。
  4. 合成 (Synthesis):最后一個(gè)“管理員”或“合成器”智能體收集所有專業(yè)智能體的輸出,并組裝成最終的、整合后的響應(yīng)。

方面

描述

何時(shí)使用

復(fù)雜報(bào)告生成:創(chuàng)建需要多個(gè)領(lǐng)域?qū)I(yè)知識(shí)的詳細(xì)報(bào)告(例如:財(cái)務(wù)分析、市場(chǎng)研究)。
軟件開(kāi)發(fā)流水線:模擬一個(gè)包含程序員、代碼審查員和項(xiàng)目經(jīng)理的開(kāi)發(fā)團(tuán)隊(duì)。
創(chuàng)意頭腦風(fēng)暴:由具有不同“個(gè)性”的智能體(樂(lè)觀、謹(jǐn)慎、富有創(chuàng)意)組成的團(tuán)隊(duì),可以產(chǎn)生更多樣化的想法。

優(yōu)勢(shì) (Strengths)

專業(yè)化和深度:每個(gè)智能體都可以針對(duì)特定領(lǐng)域進(jìn)行微調(diào),從而在其領(lǐng)域內(nèi)產(chǎn)出更高質(zhì)量的工作。
模塊化和可擴(kuò)展性:可以輕松添加、移除或升級(jí)單個(gè)智能體,而無(wú)需重新設(shè)計(jì)整個(gè)系統(tǒng)。
并行性:多個(gè)智能體可以同時(shí)處理其子任務(wù),可能縮短總體任務(wù)時(shí)間。

劣勢(shì) (Weaknesses)

協(xié)調(diào)開(kāi)銷:管理智能體之間的通信和工作流程,增加了系統(tǒng)設(shè)計(jì)的復(fù)雜性。
成本和延遲增加:運(yùn)行多個(gè)智能體涉及更多的 LLM 調(diào)用,可能比單一智能體方法更昂貴、更慢。



智能體架構(gòu) 6:規(guī)劃器執(zhí)行器驗(yàn)證器 (PEV)

規(guī)劃器執(zhí)行器驗(yàn)證器 (PlannerExecutorVerifier, PEV)架構(gòu)引入了智能體系統(tǒng)中至關(guān)重要的魯棒性 (robustness)自我修正 (self-correction)層。它借鑒了嚴(yán)格的軟件工程和質(zhì)量保證流程,即工作只有在經(jīng)過(guò)驗(yàn)證后才算“完成”。

定義:PlannerExecutorVerifier (PEV)架構(gòu)是一種三階段工作流,它明確分離了規(guī)劃、執(zhí)行和驗(yàn)證的行為。它確保在智能體繼續(xù)下一步之前,對(duì)每一步的輸出進(jìn)行驗(yàn)證,從而創(chuàng)建了一個(gè)魯棒的、自我修正的循環(huán)。

高層工作流:

  1. 規(guī)劃 (Plan):‘規(guī)劃器’智能體將高層目標(biāo)分解成一系列具體的、可執(zhí)行的步驟。
  2. 執(zhí)行 (Execute):‘執(zhí)行器’智能體執(zhí)行計(jì)劃中的下一個(gè)步驟并調(diào)用相應(yīng)的工具。
  3. 驗(yàn)證 (Verify):‘驗(yàn)證器’智能體檢查執(zhí)行器的輸出。它檢查正確性、相關(guān)性和潛在錯(cuò)誤,然后給出判斷:該步驟是成功還是失???
  4. 路由與迭代 (Route & Iterate):根據(jù)驗(yàn)證器的判斷,路由器決定下一步行動(dòng):
  • 如果步驟成功且計(jì)劃未完成,返回執(zhí)行器執(zhí)行下一步。
  • 如果步驟失敗,返回規(guī)劃器創(chuàng)建一個(gè)新的計(jì)劃,通常會(huì)提供失敗的上下文,使新計(jì)劃更智能。
  • 如果步驟成功且計(jì)劃完成,進(jìn)入最終合成步驟。

方面

描述

何時(shí)使用

安全關(guān)鍵應(yīng)用:(金融、醫(yī)療)錯(cuò)誤成本很高時(shí),PEV 提供必要的保障措施,防止智能體基于錯(cuò)誤數(shù)據(jù)行動(dòng)。
工具不可靠的系統(tǒng):處理可能不穩(wěn)定或返回不一致數(shù)據(jù)的外部 API 時(shí),驗(yàn)證器可以優(yōu)雅地捕獲故障。
高精度任務(wù):(法律、科學(xué))對(duì)事實(shí)準(zhǔn)確性要求高時(shí),驗(yàn)證器確保檢索到的每一條信息在使用前都是有效的。

優(yōu)勢(shì) (Strengths)

魯棒性與可靠性:核心優(yōu)勢(shì)是檢測(cè)和從錯(cuò)誤中恢復(fù)的能力。
模塊化:職責(zé)分離使系統(tǒng)更易于調(diào)試和維護(hù)。

劣勢(shì) (Weaknesses)

更高的延遲與成本:在每次行動(dòng)后增加驗(yàn)證步驟,涉及更多的 LLM 調(diào)用,使其成為目前最慢、最昂貴的架構(gòu)。
驗(yàn)證器復(fù)雜性:設(shè)計(jì)一個(gè)有效的驗(yàn)證器具有挑戰(zhàn)性,它需要足夠智能,能夠區(qū)分小問(wèn)題和關(guān)鍵故障。



智能體架構(gòu) 7:黑板系統(tǒng) (Blackboard Systems)

黑板系統(tǒng) (Blackboard System)是一種強(qiáng)大且高度靈活的多智能體協(xié)作模式。它借鑒了人類專家團(tuán)隊(duì)圍繞一塊實(shí)體黑板共同解決復(fù)雜問(wèn)題的理念。

與僵硬、預(yù)定義的智能體傳遞序列不同,黑板系統(tǒng)具有一個(gè)中央的、共享數(shù)據(jù)存儲(chǔ)庫(kù)(即“黑板”)。智能體可以在黑板上讀取問(wèn)題的當(dāng)前狀態(tài),并寫(xiě)下它們的貢獻(xiàn)。一個(gè)動(dòng)態(tài)控制器持續(xù)觀察黑板,并根據(jù)解決問(wèn)題所需的內(nèi)容,決定下一步激活哪個(gè)專業(yè)智能體。這實(shí)現(xiàn)了一種機(jī)會(huì)主義 (opportunistic)自發(fā)涌現(xiàn) (emergent)的工作流程。

定義:黑板系統(tǒng)是一種多智能體架構(gòu),其中多個(gè)專業(yè)智能體通過(guò)讀取和寫(xiě)入一個(gè)名為“黑板”的共享中央數(shù)據(jù)存儲(chǔ)庫(kù)進(jìn)行協(xié)作。一個(gè)控制器或調(diào)度器根據(jù)黑板上不斷演變的解決方案狀態(tài),動(dòng)態(tài)地決定下一個(gè)應(yīng)該采取行動(dòng)的智能體。

高層工作流:

  1. 共享內(nèi)存(黑板):中央數(shù)據(jù)結(jié)構(gòu)保存問(wèn)題的當(dāng)前狀態(tài),包括用戶請(qǐng)求、中間發(fā)現(xiàn)和部分解決方案。
  2. 專業(yè)智能體:一組獨(dú)立的智能體(擁有特定專業(yè)知識(shí))持續(xù)監(jiān)控黑板。
  3. 控制器 (Controller):一個(gè)中央“控制器”智能體監(jiān)控黑板,分析當(dāng)前狀態(tài),并決定哪個(gè)專業(yè)智能體最適合做出下一個(gè)貢獻(xiàn)。
  4. 機(jī)會(huì)主義激活:控制器激活選定的智能體。該智能體從黑板上讀取相關(guān)數(shù)據(jù),執(zhí)行任務(wù),并將發(fā)現(xiàn)結(jié)果寫(xiě)回黑板。
  5. 迭代:過(guò)程重復(fù),控制器以動(dòng)態(tài)序列激活不同的智能體,直到確定黑板上的解決方案已完成。

方面

描述

何時(shí)使用

復(fù)雜的、結(jié)構(gòu)不良的問(wèn)題:解決方案路徑事先未知,需要一種自發(fā)涌現(xiàn)、機(jī)會(huì)主義策略的問(wèn)題(例如:復(fù)雜診斷、科學(xué)發(fā)現(xiàn))。
多模態(tài)系統(tǒng):協(xié)調(diào)處理不同數(shù)據(jù)類型(文本、圖像、代碼)智能體的絕佳方式。
動(dòng)態(tài)態(tài)勢(shì)感知:需要從許多分散、異步的來(lái)源合成信息的場(chǎng)景。

優(yōu)勢(shì) (Strengths)

靈活性和適應(yīng)性:工作流程不是硬編碼的,而是根據(jù)問(wèn)題自發(fā)產(chǎn)生的,系統(tǒng)具有高度適應(yīng)性。
模塊化:增刪專業(yè)智能體非常容易,無(wú)需重新架構(gòu)整個(gè)系統(tǒng)。

劣勢(shì) (Weaknesses)

控制器復(fù)雜性:整個(gè)系統(tǒng)的智能程度嚴(yán)重依賴于控制器的復(fù)雜性。一個(gè)簡(jiǎn)單的控制器可能導(dǎo)致低效或循環(huán)行為。
調(diào)試挑戰(zhàn):工作流程的非線性、自發(fā)涌現(xiàn)特性有時(shí)使追蹤和調(diào)試比簡(jiǎn)單的順序過(guò)程更困難。



智能體架構(gòu) 8:情景記憶 + 語(yǔ)義記憶堆棧

標(biāo)準(zhǔn)的聊天機(jī)器人記憶是短暫的,只持續(xù)一個(gè)會(huì)話。為了構(gòu)建一個(gè)能夠隨著用戶學(xué)習(xí)和成長(zhǎng)的個(gè)性化智能體,我們需要一種更強(qiáng)大的解決方案。該架構(gòu)通過(guò)結(jié)合兩種不同的記憶類型,模擬了人類的認(rèn)知,實(shí)現(xiàn)了結(jié)構(gòu)化的記憶體系:

記憶類型

定義

存儲(chǔ)方式

作用

情景記憶 (Episodic Memory)

記錄特定事件或過(guò)去交互的記憶?;卮?strong>“發(fā)生了什么?”(例如:“上周,用戶問(wèn)我關(guān)于英偉達(dá)股價(jià)的問(wèn)題?!保?/p>

向量數(shù)據(jù)庫(kù)

用于基于語(yǔ)義相似性檢索相關(guān)的歷史對(duì)話。

語(yǔ)義記憶 (Semantic Memory)

從這些事件中提取的結(jié)構(gòu)化事實(shí)、概念和關(guān)系?;卮?strong>“我知道什么?”(例如:“用戶 Alex 是保守型投資者?!保?/p>

圖數(shù)據(jù)庫(kù) (Neo4j)

擅長(zhǎng)管理和查詢實(shí)體間的復(fù)雜關(guān)系。

通過(guò)結(jié)合這兩種記憶,智能體不僅能回憶起過(guò)去的對(duì)話,還能建立一個(gè)豐富、相互關(guān)聯(lián)的知識(shí)庫(kù),從而實(shí)現(xiàn)深度個(gè)性化和上下文感知的交互。

該架構(gòu)引入了一個(gè)完整的循環(huán),涵蓋了記憶的檢索(Recall)和創(chuàng)建(Encoding):

  1. 交互 (Interaction):用戶發(fā)起查詢。
  2. 記憶檢索(回憶):智能體查詢兩個(gè)記憶系統(tǒng):
  • 情景記憶:搜索向量存儲(chǔ),查找相似的過(guò)往對(duì)話。
  • 語(yǔ)義記憶:查詢圖數(shù)據(jù)庫(kù),查找與查詢相關(guān)的實(shí)體和事實(shí)。
  • 增強(qiáng)生成 (Augmented Generation):檢索到的記憶被添加到 LLM 的提示上下文,使模型能夠生成一個(gè)了解過(guò)去交互和已習(xí)得事實(shí)的個(gè)性化響應(yīng)。
  • 記憶創(chuàng)建(編碼):交互完成后,后臺(tái)進(jìn)程分析對(duì)話:
    • 創(chuàng)建一個(gè)簡(jiǎn)潔的輪次摘要(新的情景記憶)。
    • 提取關(guān)鍵實(shí)體和關(guān)系(新的語(yǔ)義記憶)。
  • 記憶存儲(chǔ):新的情景摘要被嵌入并保存到向量存儲(chǔ)中。新的語(yǔ)義事實(shí)以節(jié)點(diǎn)和邊的形式寫(xiě)入圖數(shù)據(jù)庫(kù)。

方面

描述

何時(shí)使用

長(zhǎng)期個(gè)人助理:助理能記住用戶數(shù)周或數(shù)月內(nèi)的偏好、項(xiàng)目和個(gè)人細(xì)節(jié)。
個(gè)性化系統(tǒng):記住用戶風(fēng)格的電商機(jī)器人,或記住學(xué)習(xí)進(jìn)度和弱點(diǎn)的教育輔導(dǎo)員。
復(fù)雜研究智能體:在探索文檔時(shí)構(gòu)建主題知識(shí)圖譜的智能體,使其能夠回答復(fù)雜的、多跳的問(wèn)題。

優(yōu)勢(shì) (Strengths)

真正的個(gè)性化:實(shí)現(xiàn)了超越單個(gè)會(huì)話上下文窗口的持久化學(xué)習(xí)和上下文。
豐富的理解:圖數(shù)據(jù)庫(kù)允許智能體理解和推理實(shí)體間的復(fù)雜關(guān)系。

劣勢(shì) (Weaknesses)

復(fù)雜性:這是一個(gè)比簡(jiǎn)單無(wú)狀態(tài)智能體復(fù)雜得多的架構(gòu),難以構(gòu)建和維護(hù)。
記憶膨脹與修剪:隨著時(shí)間推移,記憶存儲(chǔ)可能變得巨大。必須制定策略來(lái)摘要、合并或修剪舊的/不相關(guān)的記憶。



智能體架構(gòu) 9:思維樹(shù)規(guī)劃 (Tree-of-Thoughts, ToT)

ToT 智能體不是生成單一的、順序的推理線,而是在問(wèn)題的每個(gè)階段生成多個(gè)候選的“思維”或下一步。然后,它評(píng)估這些思維,修剪 (pruning)無(wú)效或前景不佳的分支,并擴(kuò)展 (expanding)最有希望的分支。這創(chuàng)建了一個(gè)搜索樹(shù),智能體可以在其中回溯、探索替代方案,并系統(tǒng)地導(dǎo)航復(fù)雜的問(wèn)題空間。

d8bf0e7c-bb98-11f0-8ce9-92fbcf53809c.png

定義:思維樹(shù) (Tree-of-Thoughts, ToT)是一種智能體推理框架,其中問(wèn)題解決被建模為在樹(shù)中進(jìn)行的搜索。智能體同時(shí)探索多個(gè)推理路徑(分支)。在每一步,它生成潛在的下一步(“思維”),評(píng)估其可行性,并決定繼續(xù)探索哪些路徑,從而有效地修剪搜索空間。

高層工作流:

  1. 分解 (Decomposition):問(wèn)題被分解成一系列步驟或思維。
  2. 思維生成 (Thought Generation):對(duì)于問(wèn)題的當(dāng)前狀態(tài),智能體生成多個(gè)潛在的下一步或思維。這在搜索樹(shù)中創(chuàng)建了分支。
  3. 狀態(tài)評(píng)估 (State Evaluation):每一個(gè)新思維(導(dǎo)致新?tīng)顟B(tài))都會(huì)被一個(gè)“批評(píng)者”或驗(yàn)證函數(shù)評(píng)估,評(píng)估其:
  • 有效性 (Validity):該行動(dòng)是否符合問(wèn)題規(guī)則?
  • 進(jìn)度 (Progress):該行動(dòng)是否讓我們更接近解決方案?
  • 修剪與擴(kuò)展 (Pruning & Expansion):無(wú)效或前景不佳的分支被修剪。智能體隨后從最有希望的活躍分支繼續(xù),重復(fù)思維生成過(guò)程。
  • 解決方案 (Solution):過(guò)程持續(xù)到達(dá)到目標(biāo)狀態(tài)。解決方案就是從根節(jié)點(diǎn)到目標(biāo)狀態(tài)的思維路徑。

方面

描述

何時(shí)使用

邏輯謎題與數(shù)學(xué)問(wèn)題:具有明確規(guī)則和目標(biāo)狀態(tài),需要多步驟、非線性推理的問(wèn)題(例如:數(shù)獨(dú)、過(guò)河謎題)。
復(fù)雜規(guī)劃:任務(wù)需要詳細(xì)規(guī)劃,操作順序至關(guān)重要且必須遵守約束(例如:規(guī)劃復(fù)雜的多站旅行)。
創(chuàng)意寫(xiě)作或代碼生成:在決定采用哪個(gè)故事分支或?qū)嵤┎呗灾?,探索多種可能性。

優(yōu)勢(shì) (Strengths)

魯棒性 (Robustness):系統(tǒng)地探索問(wèn)題空間,與單次推理方法相比,不太可能陷入困境或產(chǎn)生錯(cuò)誤答案。
處理組合復(fù)雜性:非常適用于可能序列數(shù)量龐大的問(wèn)題。

劣勢(shì) (Weaknesses)

計(jì)算成本高:需要比簡(jiǎn)單的思維鏈提示多得多的 LLM 調(diào)用和狀態(tài)管理,使其更慢、更昂貴。
依賴良好的評(píng)估器:搜索的有效性嚴(yán)重依賴于狀態(tài)評(píng)估邏輯的質(zhì)量。

智能體被構(gòu)建為一個(gè)LangGraph圖,其核心邏輯是一個(gè)循環(huán):

  1. 初始化:設(shè)置初始狀態(tài)。
  2. 擴(kuò)展 (Expand):遍歷當(dāng)前所有活躍路徑,使用get_possible_moves函數(shù)生成所有有效的下一步(思維),創(chuàng)建新的分支。
  3. 修剪 (Prune):檢查新路徑:
  • 有效性檢查:盡管生成函數(shù)已保證有效,但在此處可進(jìn)行額外檢查。
  • 循環(huán)檢查:如果路徑的最后一個(gè)狀態(tài)在之前出現(xiàn)過(guò)(形成循環(huán)),則修剪該路徑。
  • 檢查解決方案:如果任何活躍路徑達(dá)到目標(biāo)狀態(tài),則停止。否則,回到擴(kuò)展步驟。

智能體架構(gòu) 10:模擬器 / 心智模型在環(huán) (Simulator-in-the-Loop)

核心思想是讓智能體以非常具體的方式“三思而后行”。智能體不會(huì)立即在現(xiàn)實(shí)世界中執(zhí)行提議的行動(dòng),而是首先在環(huán)境的內(nèi)部模擬版本中測(cè)試該行動(dòng)。通過(guò)觀察這個(gè)安全沙盒中可能產(chǎn)生的后果,智能體可以評(píng)估風(fēng)險(xiǎn)、完善策略,然后才在現(xiàn)實(shí)中執(zhí)行一個(gè)更經(jīng)過(guò)深思熟慮的行動(dòng)。

d8d9e486-bb98-11f0-8ce9-92fbcf53809c.png

定義:模擬器心智模型在環(huán)架構(gòu)涉及一個(gè)智能體,它利用其環(huán)境的內(nèi)部模型來(lái)模擬潛在行動(dòng)的結(jié)果,然后再執(zhí)行這些行動(dòng)。這使智能體能夠進(jìn)行 **假設(shè)分析 (what-if analysis)**、預(yù)測(cè)后果,并優(yōu)化其計(jì)劃以確保安全性和有效性。

高層工作流:

  1. 觀察 (Observe):智能體觀察現(xiàn)實(shí)環(huán)境的當(dāng)前狀態(tài)。
  2. 提議行動(dòng) (Propose Action):智能體的規(guī)劃模塊根據(jù)目標(biāo)和當(dāng)前狀態(tài),生成一個(gè)高層次的擬議行動(dòng)或策略。
  3. 模擬 (Simulate):智能體將環(huán)境的當(dāng)前狀態(tài)分叉 (forks)到一個(gè)沙盒模擬中。它應(yīng)用擬議的行動(dòng),并向前運(yùn)行模擬以觀察一系列可能的結(jié)果。
  4. 評(píng)估與完善 (Assess & Refine):智能體分析模擬結(jié)果。該行動(dòng)是否導(dǎo)致了期望的結(jié)果?是否存在不可預(yù)見(jiàn)的負(fù)面后果?基于此評(píng)估,它將最初的提案完善為一個(gè)最終、具體的行動(dòng)。
  5. 執(zhí)行 (Execute):智能體在真實(shí)環(huán)境中執(zhí)行最終、完善后的行動(dòng)。
  6. 重復(fù) (Repeat):循環(huán)從現(xiàn)實(shí)環(huán)境的新?tīng)顟B(tài)開(kāi)始。

方面

描述

何時(shí)使用

機(jī)器人技術(shù):在移動(dòng)物理手臂之前模擬抓取或路徑,以避免碰撞或損壞。
高風(fēng)險(xiǎn)決策:在金融領(lǐng)域,模擬交易在不同市場(chǎng)條件下的投資組合影響;在醫(yī)療保健領(lǐng)域,模擬治療計(jì)劃的潛在效果。
復(fù)雜游戲 AI:策略游戲中的 AI 模擬幾步前的行動(dòng)來(lái)選擇最優(yōu)解。

優(yōu)勢(shì) (Strengths)

安全與風(fēng)險(xiǎn)降低:通過(guò)首先在安全環(huán)境中審查行動(dòng),極大地減少了有害或代價(jià)高昂錯(cuò)誤的發(fā)生幾率。
性能提升:允許前瞻和規(guī)劃,從而做出更健壯、更周到的決策。

劣勢(shì) (Weaknesses)

模擬-現(xiàn)實(shí)差距 (Simulation-Reality Gap):有效性完全取決于模擬器的逼真度。如果世界模型不準(zhǔn)確,智能體的計(jì)劃可能基于錯(cuò)誤的假設(shè)。
計(jì)算成本:運(yùn)行模擬(尤其是多個(gè)場(chǎng)景)的計(jì)算成本很高,并且比直接行動(dòng)要慢。

智能體架構(gòu) 12:圖 / 世界模型記憶 (Graph / World-Model Memory)

基于圖的智能體不將信息存儲(chǔ)為孤立的文本塊,而是將傳入數(shù)據(jù)解析為實(shí)體(節(jié)點(diǎn))關(guān)系(邊),從而創(chuàng)建一個(gè)豐富、可查詢的知識(shí)圖譜。智能體隨后可以通過(guò)遍歷該圖譜來(lái)回答復(fù)雜問(wèn)題,發(fā)現(xiàn)隱藏在非結(jié)構(gòu)化文本中的洞察。

d8fa3074-bb98-11f0-8ce9-92fbcf53809c.png

定義:圖 / 世界模型記憶是一種智能體架構(gòu),其中知識(shí)存儲(chǔ)在結(jié)構(gòu)化的圖數(shù)據(jù)庫(kù)中。信息被表示為節(jié)點(diǎn)(實(shí)體,如人、地點(diǎn)、概念)和(它們之間的關(guān)系)。這創(chuàng)建了一個(gè)動(dòng)態(tài)的“世界模型”,智能體可以基于此進(jìn)行推理。

高層工作流:

  1. 信息攝取 (Information Ingestion):智能體接收非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)(文本、文檔等)。
  2. 知識(shí)提取 (Knowledge Extraction):一個(gè)由 LLM 驅(qū)動(dòng)的流程解析信息,識(shí)別關(guān)鍵實(shí)體及其相互連接的關(guān)系。
  3. 圖譜更新 (Graph Update):提取的節(jié)點(diǎn)和邊被添加或更新到持久化的圖數(shù)據(jù)庫(kù)中(如 Neo4j)。
  4. 問(wèn)答 / 推理 (Question Answering / Reasoning):當(dāng)被問(wèn)及問(wèn)題時(shí),智能體執(zhí)行以下步驟:a. 將自然語(yǔ)言問(wèn)題轉(zhuǎn)換為正式的圖查詢語(yǔ)言(例如:Neo4j 的 Cypher)。 b. 對(duì)圖譜執(zhí)行查詢以檢索相關(guān)的子圖或事實(shí)。c. 將查詢結(jié)果合成為自然語(yǔ)言答案。

方面

描述

何時(shí)使用

企業(yè)知識(shí)助手:從內(nèi)部文檔中構(gòu)建公司項(xiàng)目、員工和客戶的可查詢模型。
高級(jí)研究助手:通過(guò)攝取研究論文創(chuàng)建科學(xué)領(lǐng)域的動(dòng)態(tài)知識(shí)庫(kù)。
復(fù)雜系統(tǒng)診斷:對(duì)系統(tǒng)組件及其依賴關(guān)系進(jìn)行建模以診斷故障。

優(yōu)勢(shì) (Strengths)

結(jié)構(gòu)化與可解釋:知識(shí)高度組織化??梢酝ㄟ^(guò)顯示圖譜中導(dǎo)致答案的確切路徑來(lái)解釋答案。
實(shí)現(xiàn)復(fù)雜推理:擅長(zhǎng)回答需要通過(guò)關(guān)系連接分散信息,即“多跳”問(wèn)題。

劣勢(shì) (Weaknesses)

前期復(fù)雜性:需要定義良好的模式和一個(gè)魯棒的提取過(guò)程。
圖譜更新管理:難以管理更新、解決沖突信息以及隨時(shí)間修剪過(guò)時(shí)事實(shí)(知識(shí)生命周期管理)。

使用具有結(jié)構(gòu)化輸出(Pydantic)的 LLM 作為知識(shí)提取器。它讀取文本,并以Node和Relationship的形式提取實(shí)體和關(guān)系(關(guān)系類型被大寫(xiě),如ACQUIRED)。

智能體處理了三份相互關(guān)聯(lián)但獨(dú)立的文件,逐步構(gòu)建知識(shí)圖譜:

  • 文檔 1:AlphaCorpACQUIREDBetaSolutions。
  • 文檔 2:Dr. Evelyn ReedWORKS_FORAlphaCorp,AlphaCorpPRODUCESQuantumLeap AI。
  • 文檔 3:Innovate Inc. 的 NeuraGenCOMPETES_WITHQuantumLeap AI。 該智能體實(shí)現(xiàn)了文本到 Cypher的完整管道:
  1. 生成 Cypher 查詢:LLM 將自然語(yǔ)言問(wèn)題轉(zhuǎn)換為 Cypher 語(yǔ)句。
  2. 執(zhí)行查詢:在 Neo4j 圖數(shù)據(jù)庫(kù)上運(yùn)行 Cypher 語(yǔ)句以獲取上下文。
  3. 合成最終答案:LLM 基于查詢結(jié)果提供自然語(yǔ)言答案。

智能體架構(gòu) 13:并行探索 + 集成決策 (Parallel Exploration + Ensemble Decision)

通過(guò)對(duì) AI 智能體應(yīng)用“群體的智慧”原則,解決了單個(gè) LLM 固有的不確定性和潛在偏差問(wèn)題。不依賴于單一的推理線,而是同時(shí)衍生出多個(gè)獨(dú)立的智能體,從不同的視角分析問(wèn)題。每個(gè)智能體遵循自己的推理路徑,如同專家委員會(huì)中的不同專家。然后,一個(gè)最終的“聚合器”智能體收集并合成它們的個(gè)人結(jié)論,權(quán)衡不同的觀點(diǎn),找出共識(shí)和沖突,從而產(chǎn)生一個(gè)更細(xì)致、更可靠的最終答案。

定義:并行探索 + 集成決策是一種智能體架構(gòu),其中一個(gè)問(wèn)題由多個(gè)獨(dú)立的智能體或推理路徑同時(shí)處理。然后,通過(guò)一個(gè)單獨(dú)的智能體(通常是聚合器),采用投票、建立共識(shí)或合成等方法,將所有單獨(dú)的輸出進(jìn)行集成,從而得出最終、更健壯的結(jié)論。

高層工作流:

  1. 扇出(并行探索):用戶查詢被分發(fā)給 N 個(gè)獨(dú)立的專業(yè)智能體。這些智能體通常被賦予不同的指令、角色或工具,以鼓勵(lì)分析方法的多樣性。
  2. 獨(dú)立處理:每個(gè)智能體單獨(dú)處理問(wèn)題,生成自己的完整分析、結(jié)論或答案。
  3. 扇入(聚合):收集所有 N 個(gè)智能體的輸出。
  4. 合成(集成決策):最終的“聚合器”“裁決者”智能體接收所有單個(gè)輸出。它的任務(wù)是分析這些觀點(diǎn),找出共同點(diǎn),權(quán)衡沖突的證據(jù),并合成一個(gè)全面而平衡的最終答案。

方面

描述

何時(shí)使用

困難推理問(wèn)答:對(duì)于單一推理線容易遺漏細(xì)節(jié)的復(fù)雜、模糊問(wèn)題。
事實(shí)核查與驗(yàn)證:讓多個(gè)智能體從不同來(lái)源搜索和驗(yàn)證事實(shí),可以大幅減少幻覺(jué)(虛構(gòu)信息)。
高風(fēng)險(xiǎn)決策支持:在醫(yī)學(xué)或金融等領(lǐng)域,在做出推薦前,從不同的 AI 角色那里獲得“第二意見(jiàn)”(或第三、第四意見(jiàn))。

優(yōu)勢(shì) (Strengths)

提升可靠性和準(zhǔn)確性:平均化單個(gè)智能體的隨機(jī)錯(cuò)誤或偏見(jiàn),使最終答案更有可能正確且全面。
減少幻覺(jué):如果一個(gè)智能體虛構(gòu)了事實(shí),其他智能體不太可能這樣做,聚合器很容易發(fā)現(xiàn)異常值。

劣勢(shì) (Weaknesses)

成本極高:這是計(jì)算成本最高的架構(gòu)之一,因?yàn)樗鼘?LLM 調(diào)用的數(shù)量乘以集成中的智能體數(shù)量(再加上最終的聚合調(diào)用)。
延遲增加:在最終合成開(kāi)始之前,系統(tǒng)必須等待所有并行路徑完成。



智能體架構(gòu) 14:可觀測(cè)性 + 演習(xí)線束 (Dry-Run Harness)

在沒(méi)有確切知道智能體將要做什么之前,絕不在實(shí)時(shí)環(huán)境中運(yùn)行其行動(dòng)。此架構(gòu)將“三思而后行 (look before you leap)”的過(guò)程正式化。智能體首先在演習(xí)模式(dry_run)下執(zhí)行其計(jì)劃,該模式不會(huì)改變真實(shí)世界,但會(huì)生成詳細(xì)的日志和清晰的行動(dòng)計(jì)劃。然后,此計(jì)劃會(huì)被提交給人類(或自動(dòng)檢查器)批準(zhǔn),之后才允許最終的實(shí)時(shí)執(zhí)行。

定義:可觀測(cè)性與演習(xí)線束是一種測(cè)試和部署架構(gòu),它會(huì)攔截智能體的行動(dòng)。它首先在“演習(xí)”或“沙盒”模式下執(zhí)行這些行動(dòng),模擬行動(dòng)而不會(huì)造成真實(shí)世界的影響。由此產(chǎn)生的計(jì)劃和日志會(huì)被呈現(xiàn)供審閱,只有在明確批準(zhǔn)后,行動(dòng)才會(huì)在實(shí)時(shí)環(huán)境中執(zhí)行。

高層工作流:

  1. 智能體提出行動(dòng) (Agent Proposes Action):智能體確定一個(gè)計(jì)劃或特定的工具調(diào)用。
  2. 演習(xí)執(zhí)行 (Dry Run Execution):線束使用dry_run=True標(biāo)志調(diào)用智能體的計(jì)劃。底層工具被設(shè)計(jì)為識(shí)別此標(biāo)志,并只輸出它們將要做什么,以及相應(yīng)的日志和追蹤。
  3. 收集可觀測(cè)性數(shù)據(jù) (Collect Observability Data):線束捕獲擬議的行動(dòng)、演習(xí)日志和任何相關(guān)的追蹤數(shù)據(jù)。
  4. 人類/自動(dòng)化審閱 (Human/Automated Review):這些可觀測(cè)性數(shù)據(jù)被呈現(xiàn)給審閱者。人類可以檢查正確性、安全性和目標(biāo)一致性。自動(dòng)化系統(tǒng)可以運(yùn)行策略違規(guī)檢查。
  5. 批準(zhǔn)/否決決策 (Go/No-Go Decision):審閱者做出“批準(zhǔn)”或“拒絕”的決定。
  6. 實(shí)時(shí)執(zhí)行(在“批準(zhǔn)”時(shí)):如果獲得批準(zhǔn),線束會(huì)重新執(zhí)行智能體的行動(dòng),但這次是dry_run=False,從而使其產(chǎn)生真實(shí)世界的影響。

方面

描述

何時(shí)使用

生產(chǎn)驗(yàn)證與安全:任何可以修改狀態(tài)、花費(fèi)金錢(qián)、發(fā)送通信或執(zhí)行任何其他不可逆行動(dòng)的智能體的永久生產(chǎn)功能。
調(diào)試和測(cè)試:在開(kāi)發(fā)中,了解智能體如何解釋任務(wù)以及它正在采取什么行動(dòng)而沒(méi)有副作用。
智能體的 CI/CD:將演習(xí)線束集成到自動(dòng)化測(cè)試管道中,以在部署新版本之前驗(yàn)證智能體的行為。

優(yōu)勢(shì) (Strengths)

最大透明度和安全性:提供智能體行動(dòng)的清晰、可審計(jì)的預(yù)覽,防止代價(jià)高昂或令人尷尬的錯(cuò)誤。
非常適合調(diào)試:輕松追蹤智能體的邏輯和工具調(diào)用,而無(wú)需撤銷真實(shí)世界的更改。

劣勢(shì) (Weaknesses)

延遲部署/執(zhí)行:強(qiáng)制性的審閱步驟(尤其是涉及人類時(shí))會(huì)引入延遲,使其不適合實(shí)時(shí)應(yīng)用程序。
要求工具支持:智能體使用的工具和 API 必須設(shè)計(jì)為支持dry_run模式。



智能體架構(gòu) 15:自我改進(jìn)循環(huán) (Self-Improvement Loop)

**自我改進(jìn)循環(huán) (Self-Improvement Loop)迭代地完善其輸出,從而達(dá)到更高的質(zhì)量標(biāo)準(zhǔn)。它是讓智能體隨著時(shí)間從良好的基線水平提升到專家級(jí)表現(xiàn)的機(jī)制。

這個(gè)過(guò)程模仿了人類“做獲得反饋改進(jìn)”的學(xué)習(xí)周期。Notebook 通過(guò)一個(gè)自優(yōu)化 (Self-Refine)工作流來(lái)實(shí)現(xiàn)這一點(diǎn):智能體的輸出立即由一個(gè)批評(píng)子智能體進(jìn)行評(píng)估,如果發(fā)現(xiàn)不足,則要求原始智能體根據(jù)可操作的反饋修改其工作。

定義:自我改進(jìn)循環(huán)是一種智能體架構(gòu),其中智能體的輸出由其自身或另一個(gè)智能體進(jìn)行評(píng)估,并將此評(píng)估用作反饋,以生成一個(gè)經(jīng)過(guò)修訂的、更高質(zhì)量的輸出。當(dāng)這種反饋被存儲(chǔ)并用于隨著時(shí)間推移改善智能體的基線性能時(shí),它就成為一種持續(xù)學(xué)習(xí)的形式。

高層工作流(自優(yōu)化):

  1. 生成初始輸出 (Generate Initial Output):主要智能體生成解決方案的第一個(gè)版本(“草稿”)。
  2. 批評(píng)輸出 (Critique Output):批評(píng)智能體(或處于“批評(píng)模式”下的主要智能體)根據(jù)一組預(yù)定義的標(biāo)準(zhǔn)或一般準(zhǔn)則評(píng)估草稿。
  3. 決策 (Decision):系統(tǒng)檢查批評(píng)是否足夠積極以接受輸出。
  4. 修訂(循環(huán))(Revise / Loop):如果輸出不被接受,原始草稿和批評(píng)者的反饋將傳遞回主要智能體,指示其生成一個(gè)解決反饋的修訂版本。
  5. 接受 (Accept):一旦輸出達(dá)到質(zhì)量標(biāo)準(zhǔn),循環(huán)終止,返回最終版本。

方面

描述

何時(shí)使用

高質(zhì)量?jī)?nèi)容生成:對(duì)通用初稿不足以勝任的任務(wù),例如撰寫(xiě)法律文件、詳細(xì)技術(shù)報(bào)告或有說(shuō)服力的營(yíng)銷文案。
持續(xù)學(xué)習(xí)與個(gè)性化:通過(guò)生成響應(yīng)、獲得隱性或顯性反饋,并完善其內(nèi)部策略,從而學(xué)習(xí)用戶偏好的智能體。
復(fù)雜問(wèn)題解決:智能體可以提出一個(gè)計(jì)劃,批評(píng)其缺陷或效率低下之處,然后在執(zhí)行前修訂計(jì)劃。

優(yōu)勢(shì) (Strengths)

顯著提高輸出質(zhì)量:迭代優(yōu)化始終比單次生成產(chǎn)生更好的結(jié)果。
實(shí)現(xiàn)持續(xù)學(xué)習(xí):為智能體提供一個(gè)隨著時(shí)間推移,根據(jù)新信息或反饋不斷改進(jìn)的框架。

劣勢(shì) (Weaknesses)

強(qiáng)化偏差的風(fēng)險(xiǎn):如果批評(píng)智能體具有有缺陷的邏輯或偏差,系統(tǒng)可能會(huì)陷入一個(gè)強(qiáng)化自身錯(cuò)誤的循環(huán)。
計(jì)算成本高昂:迭代性質(zhì)意味著每個(gè)任務(wù)需要多次 LLM 調(diào)用,增加了成本和延遲。

智能體架構(gòu) 16:元胞自動(dòng)機(jī) / 網(wǎng)格系統(tǒng)

在這個(gè)模型中,環(huán)境本身就變成了智能體。網(wǎng)格中的每個(gè)單元格都是一個(gè)微型智能體,擁有自己的狀態(tài)和一套簡(jiǎn)單的規(guī)則,用于根據(jù)其緊鄰的鄰居來(lái)更新?tīng)顟B(tài)。沒(méi)有中央控制器或復(fù)雜的尋路算法。相反,智能的、全局的行為是簡(jiǎn)單局部規(guī)則重復(fù)、同步應(yīng)用涌現(xiàn) (emerges)出來(lái)的。系統(tǒng)變成了一個(gè)“計(jì)算結(jié)構(gòu)”,通過(guò)信息的波狀傳播來(lái)解決問(wèn)題。

定義:基于網(wǎng)格的智能體系統(tǒng)是一種架構(gòu),其中大量簡(jiǎn)單的智能體(或“單元格”)排列在一個(gè)空間網(wǎng)格中。每個(gè)智能體都有一個(gè)狀態(tài),并根據(jù)僅考慮其緊鄰鄰居狀態(tài)的規(guī)則集同步更新其狀態(tài)。復(fù)雜、高層次的模式和問(wèn)題解決能力從這些局部交互中涌現(xiàn)出來(lái)。

高層工作流:

  1. 網(wǎng)格初始化 (Grid Initialization):創(chuàng)建單元格智能體網(wǎng)格,每個(gè)單元格初始化一個(gè)類型(如:障礙物、空白)和一個(gè)狀態(tài)(如:一個(gè)值)。
  2. 設(shè)置邊界條件 (Set Boundary Conditions):一個(gè)或多個(gè)單元格被賦予特殊狀態(tài)以啟動(dòng)計(jì)算(例如,將“目標(biāo)”單元格的值設(shè)置為 0)。
  3. 同步時(shí)鐘 (Synchronous Tick):系統(tǒng)“滴答”向前。在每個(gè)時(shí)鐘周期,每個(gè)單元格根據(jù)其鄰居的當(dāng)前狀態(tài)同時(shí)計(jì)算其下一個(gè)狀態(tài)。
  4. 涌現(xiàn) (Emergence):隨著系統(tǒng)的推進(jìn),信息像波浪一樣在網(wǎng)格中傳播。這會(huì)創(chuàng)建梯度、路徑和其他復(fù)雜結(jié)構(gòu)。
  5. 狀態(tài)穩(wěn)定 (State Stabilization):系統(tǒng)運(yùn)行直到網(wǎng)格狀態(tài)穩(wěn)定(不再發(fā)生變化),表明計(jì)算已完成。
  6. 讀取結(jié)果 (Readout):問(wèn)題的解決方案直接從網(wǎng)格的最終狀態(tài)中讀取(例如,通過(guò)沿著計(jì)算出的梯度追蹤)。

方面

描述

何時(shí)使用

空間推理與物流:動(dòng)態(tài)環(huán)境中(如倉(cāng)庫(kù)示例)的最佳尋路。
復(fù)雜系統(tǒng)模擬:建模具有涌現(xiàn)行為的現(xiàn)象,如森林火災(zāi)、疾病傳播或城市增長(zhǎng)。
并行計(jì)算:某些算法可以映射到元胞自動(dòng)機(jī)模型,以便在高度并行的硬件(如 GPU)上執(zhí)行。

優(yōu)勢(shì) (Strengths)

高并行性:邏輯本質(zhì)上是并行的,在合適的硬件上速度極快。
適應(yīng)性:系統(tǒng)可以動(dòng)態(tài)地對(duì)環(huán)境變化(如新的障礙物)做出反應(yīng),只需重新傳播波浪。
涌現(xiàn)的復(fù)雜性:可以用令人驚訝的簡(jiǎn)單規(guī)則解決非常復(fù)雜的問(wèn)題。

劣勢(shì) (Weaknesses)

設(shè)計(jì)復(fù)雜性:設(shè)計(jì)局部規(guī)則以產(chǎn)生所需的全局行為可能具有挑戰(zhàn)性且不直觀。
內(nèi)省性差:很難詢問(wèn)單個(gè)單元格為什么具有某種狀態(tài);推理分布在整個(gè)系統(tǒng)中。

智能體架構(gòu) 17:反思性元認(rèn)知智能體

元認(rèn)知智能體超越了簡(jiǎn)單的自我反思。它維護(hù)著一個(gè)明確的“自我模型 (Self-Model)”——對(duì)其自身知識(shí)、工具和邊界的結(jié)構(gòu)化表示。當(dāng)面對(duì)一項(xiàng)任務(wù)時(shí),它的第一步不是解決問(wèn)題,而是根據(jù)其自我模型來(lái)分析問(wèn)題。它會(huì)問(wèn)內(nèi)部問(wèn)題,例如:

  • “我是否有足夠的知識(shí)自信地回答這個(gè)問(wèn)題?”
  • “這個(gè)主題是否在我指定的專業(yè)領(lǐng)域內(nèi)?”
  • “用戶查詢是否涉及錯(cuò)誤可能帶來(lái)危險(xiǎn)的高風(fēng)險(xiǎn)主題?”

根據(jù)這些答案,它會(huì)選擇一種策略:直接推理、使用專業(yè)工具,或者——最重要的是——當(dāng)任務(wù)超出其已知限制時(shí)上報(bào)給人類。

定義:反思性元認(rèn)知智能體是一種智能體,它維護(hù)并使用關(guān)于其自身能力、知識(shí)邊界和信心水平的明確模型,來(lái)為給定任務(wù)選擇最合適的策略。這種自我建模使其行為更安全、更可靠,尤其是在錯(cuò)誤信息可能有害的領(lǐng)域。

高層工作流:

  1. 感知任務(wù) (Perceive Task):智能體接收用戶請(qǐng)求。
  2. 元認(rèn)知分析(自我反思)(Metacognitive Analysis):智能體的核心推理引擎根據(jù)其自我模型分析請(qǐng)求。它評(píng)估其信心、工具的相關(guān)性,以及查詢是否在其預(yù)定義的操作領(lǐng)域內(nèi)。
  3. 策略選擇 (Strategy Selection):基于分析,智能體選擇以下策略之一:
  • 直接推理 (Reason Directly):適用于高信心、低風(fēng)險(xiǎn)的知識(shí)庫(kù)內(nèi)查詢。
  • 使用工具 (Use Tool):當(dāng)查詢需要智能體通過(guò)工具擁有的特定能力時(shí)。
  • 上報(bào)/拒絕 (Escalate/Refuse):適用于低信心、高風(fēng)險(xiǎn)或超出范圍的查詢。
  • 執(zhí)行策略 (Execute Strategy):執(zhí)行所選擇的路徑。
  • 響應(yīng) (Respond):智能體提供結(jié)果,可能是直接答案、工具增強(qiáng)的答案,或帶有咨詢專家指示的安全拒絕。

方面

描述

何時(shí)使用

高風(fēng)險(xiǎn)咨詢系統(tǒng):任何在醫(yī)療保健、法律或金融等領(lǐng)域提供信息的系統(tǒng),智能體必須能夠說(shuō)“我不知道”或“您應(yīng)該咨詢專業(yè)人士”。
自主系統(tǒng):機(jī)器人必須在嘗試物理任務(wù)之前,評(píng)估自己安全執(zhí)行任務(wù)的能力。
復(fù)雜工具協(xié)調(diào)器:智能體必須從龐大的庫(kù)中選擇正確的 API,并了解某些 API 比其他 API 更危險(xiǎn)或成本更高。

優(yōu)勢(shì) (Strengths)

增強(qiáng)安全性和可靠性:智能體被明確設(shè)計(jì)為避免在其非專業(yè)領(lǐng)域做出自信的斷言。
改進(jìn)決策制定:通過(guò)強(qiáng)制進(jìn)行深思熟慮的策略選擇,而不是天真地直接嘗試,從而實(shí)現(xiàn)更穩(wěn)健的行為。

劣勢(shì) (Weaknesses)

自我模型的復(fù)雜性:定義和維護(hù)準(zhǔn)確的自我模型可能很復(fù)雜。
元認(rèn)知開(kāi)銷:初始分析步驟增加了每個(gè)請(qǐng)求的延遲和計(jì)算成本。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    37534

    瀏覽量

    293259
  • 語(yǔ)言模型
    +關(guān)注

    關(guān)注

    0

    文章

    568

    瀏覽量

    11236
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    373

    瀏覽量

    11492
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    富士康在美拿到285億補(bǔ)貼 美媒寫(xiě)2萬(wàn)字長(zhǎng)文討伐

    預(yù)計(jì)兩年時(shí)間建成,6月剛由特朗普親自奠基的富士康美國(guó)工廠正遭受當(dāng)?shù)剌浾撚懛?。?dāng)?shù)貢r(shí)間29日,美國(guó)媒體TheVerge發(fā)表一篇超2萬(wàn)字的文章,痛斥威斯康星州政府41億美元(約合人民幣285億元)巨資
    發(fā)表于 11-02 09:12 ?2541次閱讀

    《零基礎(chǔ)開(kāi)發(fā)AI Agent——手把手教你用扣子做智能

    《零基礎(chǔ)開(kāi)發(fā)AI Agent——手把手教你用扣子做智能》是一本為普通人量身打造的AI開(kāi)發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過(guò)
    發(fā)表于 03-18 12:03

    探究物聯(lián)網(wǎng)行業(yè)的一線聲音

    在這篇萬(wàn)字長(zhǎng)文中,共有45家企業(yè)說(shuō)出了關(guān)于物聯(lián)網(wǎng)行業(yè)的,企業(yè)的年度感想。
    的頭像 發(fā)表于 02-05 17:16 ?4762次閱讀

    萬(wàn)字詳細(xì)圖文剖析電源PCB布板與EMC的關(guān)系資料下載

    電子發(fā)燒友網(wǎng)為你提供萬(wàn)字詳細(xì)圖文剖析電源PCB布板與EMC的關(guān)系資料下載的電子資料下載,更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計(jì)、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發(fā)表于 04-17 08:52 ?15次下載
    <b class='flag-5'>萬(wàn)字</b><b class='flag-5'>詳細(xì)</b>圖文剖析電源PCB布板與EMC的關(guān)系資料下載

    人工智能300年!LSTM之父萬(wàn)字長(zhǎng)文:詳解現(xiàn)代AI和深度學(xué)習(xí)發(fā)展史

    來(lái)源:新智元 編輯:昕朋 好困 導(dǎo)讀 最近,LSTM之父Jürgen Schmidhuber梳理了17世紀(jì)以來(lái)人工智能的歷史。在這篇萬(wàn)字長(zhǎng)文中,Schmidhuber為讀者提供了一個(gè)大事年表,其中
    的頭像 發(fā)表于 01-10 12:25 ?968次閱讀

    萬(wàn)字長(zhǎng)文聊聊“車(chē)規(guī)級(jí)”芯片

    AEC-Q100 是一基于封裝集成電路應(yīng)力測(cè)試的失效機(jī)制。汽車(chē)電子委員會(huì)(AEC)總部設(shè)在美國(guó),最初由三大汽車(chē)制造商(克萊斯勒、福特和通用汽車(chē))建立,目的是建立共同的零部件資格和質(zhì)量體系標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 03-10 09:28 ?2385次閱讀

    萬(wàn)字長(zhǎng)文聊聊“車(chē)規(guī)級(jí)”芯片

    AEC-Q100 是一基于封裝集成電路應(yīng)力測(cè)試的失效機(jī)制。汽車(chē)電子委員會(huì)(AEC)總部設(shè)在美國(guó),最初由三大汽車(chē)制造商(克萊斯勒、福特和通用汽車(chē))建立,目的是建立共同的零部件資格和質(zhì)量體系標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 03-29 10:46 ?1944次閱讀

    人工智能300年!LSTM之父萬(wàn)字長(zhǎng)文:詳解現(xiàn)代AI和深度學(xué)習(xí)發(fā)展史

    來(lái)源:新智元編輯:昕朋好困導(dǎo)讀最近,LSTM之父JürgenSchmidhuber梳理了17世紀(jì)以來(lái)人工智能的歷史。在這篇萬(wàn)字長(zhǎng)文中,Schmidhuber為讀者提供了一個(gè)大事年表,其中包括神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 01-13 11:02 ?1583次閱讀
    人工<b class='flag-5'>智能</b>300年!LSTM之父<b class='flag-5'>萬(wàn)字長(zhǎng)文</b>:詳解現(xiàn)代<b class='flag-5'>AI</b>和深度學(xué)習(xí)發(fā)展史

    萬(wàn)字長(zhǎng)文盤(pán)點(diǎn)!2022十大AR工業(yè)典型案例,不可不看!

    萬(wàn)字長(zhǎng)文盤(pán)點(diǎn)!2022十大AR工業(yè)典型案例,不可不看!
    的頭像 發(fā)表于 01-17 14:43 ?3207次閱讀
    近<b class='flag-5'>萬(wàn)字長(zhǎng)文</b>盤(pán)點(diǎn)!2022十大AR工業(yè)典型案例,不可不看!

    如何用AI聊天機(jī)器人寫(xiě)出萬(wàn)字長(zhǎng)文

    如何用AI聊天機(jī)器人寫(xiě)出萬(wàn)字長(zhǎng)文
    的頭像 發(fā)表于 12-26 16:25 ?2068次閱讀

    阿里通義千問(wèn)重磅升級(jí),免費(fèi)開(kāi)放1000萬(wàn)字長(zhǎng)文檔處理功能

    近日,阿里巴巴旗下的人工智能應(yīng)用通義千問(wèn)迎來(lái)重磅升級(jí),宣布向所有人免費(fèi)開(kāi)放1000萬(wàn)字長(zhǎng)文檔處理功能,這一創(chuàng)新舉措使得通義千問(wèn)成為全球文檔處理容量第一的AI應(yīng)用。
    的頭像 發(fā)表于 03-26 11:09 ?1425次閱讀

    AI智能逼真模擬人類行為

    近日,據(jù)外媒最新報(bào)道,斯坦福大學(xué)、華盛頓大學(xué)與Google DeepMind的科研團(tuán)隊(duì)攜手合作,成功開(kāi)發(fā)出一能夠高度逼真模擬人類行為的AI智能。 該
    的頭像 發(fā)表于 11-26 10:24 ?1104次閱讀

    【6千字長(zhǎng)文】車(chē)載芯片的技術(shù)沿革與趨勢(shì)分析

    【本文是讀者投稿。6千字長(zhǎng)文,規(guī)格嚴(yán)謹(jǐn)?!?1什么是芯片?什么是汽車(chē)芯片?芯片,通俗地說(shuō),就是一塊小硅片集成了許多微小的電子元件,如晶體管、電阻、電容等元件通過(guò)復(fù)雜的電路連接在一起,形成一個(gè)功能強(qiáng)大
    的頭像 發(fā)表于 12-31 22:37 ?1861次閱讀
    【6千<b class='flag-5'>字長(zhǎng)文</b>】車(chē)載芯片的技術(shù)沿革與趨勢(shì)分析

    什么是AI智能

    實(shí)現(xiàn)自我優(yōu)化,從而為用戶提供更加精準(zhǔn)的服務(wù)。AI智能的工作原理AI智能
    的頭像 發(fā)表于 04-16 09:52 ?1501次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    AI智能的技術(shù)應(yīng)用與未來(lái)圖景

    AI智能技術(shù)正經(jīng)歷從感知智能向認(rèn)知智能的范式躍遷。其技術(shù)架構(gòu)已形成感知、決策、執(zhí)行的三層融合體
    的頭像 發(fā)表于 07-24 11:04 ?712次閱讀