2023年,生成式AI爆發(fā)。2024年,智能體(Agent)接棒成為AI新焦點(diǎn)。
進(jìn)入2025年,智能體似乎已經(jīng)要開始爆發(fā)了。數(shù)以千計(jì)的智能體項(xiàng)目如雨后春筍般涌現(xiàn),AutoGPT、LangGraph、OpenAgents……它們仿佛是未來“數(shù)字員工”的雛形,可以自動(dòng)瀏覽網(wǎng)頁、調(diào)用工具、分析數(shù)據(jù)、執(zhí)行任務(wù)。
然而問題是:這些智能體真的能“協(xié)作”嗎?
目前的智能體更像一個(gè)個(gè)“單機(jī)版App”:它們彼此不了解、無法通信,更談不上協(xié)作。這就像我們在互聯(lián)網(wǎng)早期,只有單機(jī)計(jì)算機(jī),沒有TCP/IP協(xié)議,沒有Web,信息流無法跨越“終端孤島”。
所以,問題來了:智能體的TCP/IP協(xié)議,會(huì)是什么?
今天,越來越多研究者和開發(fā)者開始聚焦一個(gè)新方向:Agent-to-Agent通信協(xié)議(A2A),以及更通用的智能體多邊通信協(xié)議(Multi-agent Communication Protocol,MCP)。這些協(xié)議的目標(biāo),是為所有智能體建立一套“公共語言”和“通信規(guī)則”。
一旦MCP類協(xié)議真正成熟,就不只是讓智能體能協(xié)作——而是標(biāo)志著“智能體互聯(lián)網(wǎng)”正式誕生。
本文將從TCP/IP的歷史啟發(fā)出發(fā),深入解析A2A/MCP協(xié)議的結(jié)構(gòu)、范式轉(zhuǎn)變、潛在爆發(fā)點(diǎn),以及下一代AI開發(fā)者和創(chuàng)業(yè)者的巨大機(jī)會(huì)窗口。這是一次基礎(chǔ)設(shè)施級別的革命,也可能是智能體生態(tài)中最被低估的黃金礦脈。
MCP/A2A ≈ TCP/IP?
互聯(lián)網(wǎng)是怎么誕生的?
如果你把時(shí)間撥回到1970年代,那時(shí)候的計(jì)算機(jī)還像“孤島”。不同廠商的主機(jī)系統(tǒng)彼此封閉,通信協(xié)議五花八門,根本無法互相理解。那時(shí)沒人能預(yù)見,幾十年后,一個(gè)叫TCP/IP的通信協(xié)議會(huì)統(tǒng)一所有設(shè)備,讓W(xué)eb、App、社交網(wǎng)絡(luò)成為可能,徹底改變?nèi)祟惿鐣?huì)的信息結(jié)構(gòu)。
今天的智能體世界,正處在那個(gè)“互聯(lián)網(wǎng)誕生前夜”的階段。
現(xiàn)在的智能體,看起來很強(qiáng),但其實(shí)彼此之間是“啞巴”狀態(tài)。一個(gè)基于AutoGPT的任務(wù)智能體,幾乎無法與另一個(gè)OpenAgents風(fēng)格的工具調(diào)度型Agent協(xié)同完成復(fù)雜任務(wù),彼此模型不同、框架不同、意圖表達(dá)方式不同。正如沒有TCP/IP之前,蘋果機(jī)和IBM主機(jī)彼此之間根本無法連通。
而MCP(Multi-agent Communication Protocol)、A2A(Agent-to-Agent)這些協(xié)議,正是在解決類似的問題:“如何讓智能體理解彼此、協(xié)作彼此、信任彼此。”
我們不妨放上一張類比圖:
通過這個(gè)類比,我們看到:每一個(gè)繁榮的信息系統(tǒng),背后都需要一套高效、通用、低摩擦的通信協(xié)議。
而MCP和A2A協(xié)議,可能就是智能體世界的“TCP/IP時(shí)刻”。
MCP / A2A 在做哪些關(guān)鍵事?
講協(xié)議,不是講“如何聊天”,而是講“怎么理解、協(xié)作、落地”。MCP 和 A2A 協(xié)議的目標(biāo)不是讓智能體會(huì)發(fā)消息,而是建立一套智能體間 “可協(xié)作、可組合、可演化”的通用語言與行為約定。
一個(gè)成熟的智能體通信協(xié)議,通常需要覆蓋以下幾個(gè)關(guān)鍵功能:
1. 發(fā)現(xiàn)與注冊(Discovery & Registry)
誰是我可以協(xié)作的Agent?
它提供什么能力?接口?權(quán)限?
它當(dāng)前在線嗎?處于什么狀態(tài)?
對應(yīng)互聯(lián)網(wǎng)世界,就是DNS + 服務(wù)注冊中心。沒有它,Agent 根本不知道去哪兒找“隊(duì)友”。
2. 身份與信任(Authentication & Trust)
我如何確定你是“你”?
這個(gè)智能體有沒有權(quán)限執(zhí)行這個(gè)任務(wù)?
如何記錄、驗(yàn)證、甚至追溯它的行為?
類比來看,這是從TLS、OAuth 到 Web3 的 DID / ZKP 演化路徑的“智能體版本”。
3. 意圖表達(dá)(Intention Declaration)
我想做一件事,怎么表達(dá)清楚?
我需要另一個(gè)Agent協(xié)助完成一個(gè)子任務(wù),怎么打包請求?
這就像是HTTP POST,但更像是“任務(wù)計(jì)劃 + 語義接口”的組合,常用結(jié)構(gòu)包括:plan DSL(計(jì)劃語言);JSON-Like 意圖協(xié)議(LangGraph、AutoGen 的風(fēng)格);Chain-of-Thought 顯式結(jié)構(gòu)。
4. 任務(wù)協(xié)商與能力匹配(Negotiation & Capability Matching)
不是所有Agent都能處理所有請求,智能體需要“篩選”合作伙伴:能不能做?愿不愿做?要不要收費(fèi)?是否需要繼續(xù)拆解為子任務(wù)再外包?
某種程度上,這是“函數(shù)簽名”+“上下文理解”+“成本博弈”的復(fù)合過程。
5. 狀態(tài)共享與反饋回傳(State & Result Sharing)
任務(wù)完成后,結(jié)果要能“接力”給上游Agent或調(diào)度系統(tǒng)。也就是說:輸出結(jié)構(gòu)化內(nèi)容;報(bào)告中間狀態(tài)/ 異常處理;支持流水線任務(wù)結(jié)構(gòu)。
這就是為什么現(xiàn)在很多Agent框架(LangGraph、CrewAI等)強(qiáng)調(diào)workflow DAG、狀態(tài)機(jī)、或消息中間件。
從點(diǎn)智能體,到“多智能體網(wǎng)絡(luò)”
互聯(lián)網(wǎng)改變了計(jì)算機(jī)的角色:從孤島終端→ 網(wǎng)絡(luò)節(jié)點(diǎn)。
智能體協(xié)議的誕生,正在做同樣的事情:讓AI從單一工具 → 協(xié)作體、組織體、網(wǎng)絡(luò)體。
今天我們用智能體,大多還處在“單人模式”:用AutoGPT做一個(gè)任務(wù)流程自動(dòng)機(jī);用ChatGPT、智譜清言、Kimi、文心一言調(diào)用插件完成特定目標(biāo);用LangChain串一個(gè)任務(wù)鏈。
但本質(zhì)上,它們都像是一個(gè)人機(jī)合一的超級函數(shù):可以被調(diào)度,但難以協(xié)作。
而一旦MCP、A2A 等協(xié)議體系成熟,Agent 就不僅僅是“能工作”,而是“能協(xié)作、能交互、能組合”的實(shí)體,它們將演化出一種新的運(yùn)行模式:
范式轉(zhuǎn)變一:從單任務(wù)執(zhí)行→ 跨Agent任務(wù)協(xié)作
在傳統(tǒng)智能體架構(gòu)中,一個(gè)Agent要完成復(fù)雜任務(wù),必須自己包辦一切。而在協(xié)議驅(qū)動(dòng)的Agent網(wǎng)絡(luò)中:任務(wù)可以被拆解,分發(fā)給其他更擅長的Agent;Agent本身甚至可以是“任務(wù)路由器”,專責(zé)調(diào)度、反饋、聚合。
就像微服務(wù)架構(gòu)替代了大單體程序,一個(gè)“Task-Oriented Agent Network(任務(wù)驅(qū)動(dòng)的智能體網(wǎng)絡(luò))”將替代胖大的全能Agent。
范式轉(zhuǎn)變二:從AI能力聚合 → AI能力編排
目前Agent的“多工具”支持,靠的是插件、函數(shù)調(diào)用、Prompt拼接。
未來的Agent之間將通過MCP協(xié)議自然協(xié)作,不需要每個(gè)Agent集成全部能力,而是:一個(gè)具備記憶/知識(shí)的Agent可以作為知識(shí)中臺(tái);一個(gè)視覺分析Agent接收圖像,轉(zhuǎn)給文本Agent做解讀;一個(gè)法律顧問Agent可以協(xié)作財(cái)務(wù)Agent、翻譯Agent、寫作Agent,一起搞定一份完整標(biāo)書。
這意味著我們正在逼近“Agent as Service”的云原生智能形態(tài)。
范式轉(zhuǎn)變?nèi)簭娜祟愓{(diào)度→ Agent自治編排
*突破性的躍遷,是Agent之間開始“自組織”完成任務(wù)。
任務(wù)從用戶出發(fā),只指定目標(biāo)或高階意圖;
Agent調(diào)度Agent,生成鏈?zhǔn)胶献鹘Y(jié)構(gòu);
有的負(fù)責(zé)搜索,有的負(fù)責(zé)判斷,有的負(fù)責(zé)寫報(bào)告;
所有人類要做的,只是檢查最終結(jié)果是否合理。
這就像是你發(fā)一條“寫份行業(yè)研究報(bào)告”,然后后臺(tái)幾十個(gè)Agent各司其職,自動(dòng)完成它,最后一個(gè)“匯報(bào)Agent”將結(jié)果發(fā)回給你。
這,才是“Agent互聯(lián)網(wǎng)”的真正爆發(fā)點(diǎn)。
需要指出的是,協(xié)議不是配件,而是范式發(fā)動(dòng)機(jī)。就像TCP/IP定義了“設(shè)備如何成為網(wǎng)絡(luò)節(jié)點(diǎn)”,MCP/A2A協(xié)議將定義“Agent如何成為生態(tài)成員”。
MCP 并不是一個(gè)“用不用都無所謂”的外掛模塊,它更像是“可組合智能體系統(tǒng)”所依賴的血液循環(huán)系統(tǒng)。如果沒有它,每個(gè)Agent就是信息孤島、技能孤島、協(xié)作孤島。
而一旦這種協(xié)議體系成熟,智能體網(wǎng)絡(luò)將不只是變多、變強(qiáng),而是變成一個(gè)可以自我組織、進(jìn)化和擴(kuò)張的全新生態(tài)系統(tǒng)。
當(dāng)“AgentNet”形成,會(huì)發(fā)生什么?
接下來,我們不妨?xí)诚胍幌拢坏〢gent構(gòu)建的智能體互聯(lián)網(wǎng)構(gòu)建完成,會(huì)發(fā)生什么?
想象一下這樣一個(gè)場景:
你只需要對系統(tǒng)說一句:“幫我準(zhǔn)備一份關(guān)于人工智能在醫(yī)療行業(yè)的研究報(bào)告,下周五前提交。”你沒明確誰做、怎么做、數(shù)據(jù)從哪來。
結(jié)果?10分鐘后你收到一條通知:
報(bào)告結(jié)構(gòu)已擬定(由結(jié)構(gòu)規(guī)劃Agent完成)
數(shù)據(jù)收集任務(wù)分發(fā)完成(由搜索Agent協(xié)同多個(gè)爬蟲Agent)
報(bào)告撰寫Agent已啟動(dòng)工作,ETA:48小時(shí)內(nèi)初稿完成
法律審查、行業(yè)術(shù)語潤色、引用核驗(yàn)已排入后續(xù)流程
這是AgentNet 的雛形:一個(gè)由多個(gè)Agent組成的自治網(wǎng)絡(luò)系統(tǒng)。那么,要構(gòu)建這樣一個(gè)Agent智能互聯(lián)網(wǎng),需要做哪些事情呢?大體來看,也許可以從以下幾步來著手:
1. Agent Registry:像DNS一樣的“智能體黃頁”
首先,需要構(gòu)建一個(gè)全球或本地的Agent 注冊平臺(tái),就像域名系統(tǒng):
注冊智能體→ 告知它能干什么、如何接入
檢索智能體→ 快速查找匹配任務(wù)的*Agent
按需組合智能體→ 類似調(diào)用微服務(wù)API,但更加語義驅(qū)動(dòng)
你可以用自然語言說“找個(gè)懂歐盟GDPR的法律Agent”,平臺(tái)就能幫你找到。
2. Agent Explorer / Browser:智能體世界的“Chrome”
當(dāng)我們構(gòu)建好一個(gè)Agent瀏覽器,那你就能不再瀏覽網(wǎng)頁,而是在瀏覽“Agent能力”:
哪些Agent正在運(yùn)行?最近活躍的是誰?
哪些Agent正在協(xié)作?組成了什么“工作組”?
用戶也可以“收藏”、“關(guān)注”Agent,未來甚至可能出現(xiàn)“智能體社交圖譜”。
這個(gè)時(shí)候,Agent 也許不再是無名助手,而是“有身份、有履歷、有服務(wù)歷史”的智能體個(gè)體。
3. Agent Middleware:調(diào)度、治理、限流、防火墻... 一應(yīng)俱全
下一步,就是Agent網(wǎng)絡(luò)的治理。就像互聯(lián)網(wǎng)有Nginx、API Gateway、Service Mesh,AgentNet也需要:請求調(diào)度與負(fù)載均衡;訪問權(quán)限管理、數(shù)據(jù)隔離;Agent間通信路由和失敗回退機(jī)制;性能指標(biāo)采集與鏈路追蹤。
在沒有中間件的今天,多Agent協(xié)作只能靠“硬Prompt” + 人工審核,未來則將趨于模塊化、工程化、自動(dòng)化。
4. 信任與驗(yàn)證機(jī)制:智能體的“數(shù)字身份系統(tǒng)”
當(dāng)Agent真正開始接觸金錢、隱私、合約,它們必須“可信”。所以,就必須構(gòu)建一個(gè)基于身份的信任系統(tǒng):
是否需要Agent身份注冊(類似DID)?
是否需要零知識(shí)證明來驗(yàn)證某個(gè)Agent的知識(shí)或執(zhí)行歷史?
是否存在“智能體信用體系”,或Agent版區(qū)塊鏈記錄?
在沒有信任機(jī)制的世界,Agent只能跑在沙箱里;一旦解決信任,它們就可以真正接觸現(xiàn)實(shí)世界。
5. 智能體的Web 1.0 → Web 3.0 演進(jìn)路徑
接下來,我們將要目睹一個(gè)新的“互聯(lián)網(wǎng)成長曲線”,只不過這次不是人類用網(wǎng)頁連接,而是Agent用協(xié)議協(xié)作。我們可以類比Web 1.0 → Web 3.0 演進(jìn)路徑,來預(yù)測一下Agent 1.0到Agent 2.0,將如何演進(jìn)。
這不僅是“未來想象”,而是正在發(fā)生的系統(tǒng)性轉(zhuǎn)變。如果說ChatGPT、DeepSeek是“個(gè)人智能終端”的誕生,那么 MCP/A2A 所構(gòu)建的 AgentNet,就是整個(gè)“智能體宇宙的互聯(lián)網(wǎng)底座”。
誰在做?又能做什么?
愿景再宏大,如果脫離現(xiàn)實(shí),也不過是一場空談。幸運(yùn)的是,Agent通信協(xié)議的建設(shè)正在全球多個(gè)維度并行展開,且中 美之間已經(jīng)出現(xiàn)了“賽道初現(xiàn)”的格局。
海外陣營:A2A / MCP 雙軌并行,生態(tài)成型中
2024年底,谷歌聯(lián)合多家全球科技巨頭發(fā)布了開放協(xié)議 Agent2Agent(A2A),目標(biāo)明確:讓不同廠商、不同平臺(tái)構(gòu)建的智能體彼此通信、互操作、協(xié)作完成任務(wù)。
A2A 是一個(gè)更偏底層的“Agent通信協(xié)議棧”,專注解決 Agent “說話”和“理解”彼此的問題。它得到了以下企業(yè)的加入或支持:Atlassian、Box、Cohere、Intuit、MongoDB、PayPal、Salesforce、SAP、Workday 等; LangChain、ServiceNow、UKG 等智能體/企業(yè)服務(wù)平臺(tái)。
這一協(xié)議的核心理念是:智能體不應(yīng)該局限在某個(gè)平臺(tái)內(nèi)部,而應(yīng)像網(wǎng)頁一樣,跨系統(tǒng)自由交互。
相比之下,Anthropic主推的MCP協(xié)議(Multi-agent Communication Protocol)更多聚焦于:智能體如何調(diào)用外部工具、插件、服務(wù);多智能體之間如何基于任務(wù)和角色分工協(xié)作;構(gòu)建“協(xié)同工作流”而非簡單通信通道。
對比來看,A2A偏向通信協(xié)議棧,MCP偏向協(xié)作協(xié)議層——兩者正在形成互補(bǔ)共振的態(tài)勢。
國內(nèi)賽道:阿里、騰訊、百度、字節(jié)跳動(dòng)集體押注“智能體基礎(chǔ)設(shè)施”
不久前,MCP協(xié)議這場基礎(chǔ)設(shè)施之戰(zhàn),正式在國內(nèi)開打。
例如,2025年4月9日,阿里云百煉推出 全生命周期MCP服務(wù)。借助該服務(wù),用戶無需運(yùn)維、無需部署,5分鐘內(nèi)就可搭建一個(gè)MCP智能體。并且,改服務(wù)首批集成了高德、無影、Fetch、Notion等 50+ MCP服務(wù),功能打通 + 實(shí)戰(zhàn)可用。
騰訊也不甘落后,2025年4月14日,騰訊云宣布其大模型知識(shí)引擎支持 MCP 協(xié)議。發(fā)布“AI開發(fā)套件”,讓開發(fā)者快速構(gòu)建可被調(diào)度的業(yè)務(wù)型Agent。支持自定義或平臺(tái)精選 MCP 插件調(diào)用,降低Agent構(gòu)建門檻。可以看出,騰訊押注的是“企業(yè)智能體中臺(tái)”這個(gè)方向。
再看看百度,2025年3月21日,百度地圖宣布核心API 全面兼容MCP協(xié)議,為智能體提供位置信息能力。并且,企其將在2025年4月25日Create開發(fā)者大會(huì) 上發(fā)布 MCP插件市場——MCPstore。
從目前情況看,中 美的頭部企業(yè)都在積極布局智能體協(xié)議,但也呈現(xiàn)出不同的特點(diǎn):
可以說,這不是一場單點(diǎn)突破的技術(shù)戰(zhàn),而是一次“下一代互聯(lián)網(wǎng)協(xié)議棧”的競速賽。
那么,對于各個(gè)參與方來說,都能做些什么呢?
對創(chuàng)業(yè)者來說,別再卷一個(gè)GPT封裝工具了,現(xiàn)在正是做“AgentNet層協(xié)議、通用組件、中間件服務(wù)”的*窗口期。可以類比做Stripe于支付、Twilio于通信、Zapier于集成,或者做Agent通信的Mesh網(wǎng)絡(luò),做Agent的注冊與發(fā)現(xiàn)服務(wù),機(jī)會(huì)很多。
對于開發(fā)者來說,可以參與構(gòu)建:開源協(xié)議庫:為不同Agent架構(gòu)適配MCP/A2A協(xié)議;協(xié)作組件:任務(wù)打包、結(jié)果聚合、異常處理等通用Agent模塊;注冊機(jī)制,Agent如何聲明自己、認(rèn)證身份、暴露能力?一個(gè)MCP兼容組件,可能比你寫的10個(gè)Prompt更具網(wǎng)絡(luò)效應(yīng)。
對于企業(yè)來說,現(xiàn)在就是構(gòu)建企業(yè)專屬Agent網(wǎng)絡(luò)的*時(shí)機(jī),比如,可以把知識(shí)庫變成Agent接口;把流程定義成任務(wù)協(xié)議;把業(yè)務(wù)系統(tǒng)接入MCP,打造“AI工作團(tuán)隊(duì)”。
1973年,TCP/IP協(xié)議剛剛提出時(shí),沒人認(rèn)為這套“連接機(jī)器的語言”會(huì)改變世界。
但事實(shí)證明,它并不是一個(gè)技術(shù)細(xì)節(jié),而是一次改變整個(gè)互聯(lián)網(wǎng)產(chǎn)業(yè)的范式轉(zhuǎn)變。它讓計(jì)算機(jī)從孤島變成網(wǎng)絡(luò)節(jié)點(diǎn),從計(jì)算工具變成信息社會(huì)的血管系統(tǒng)。
今天,MCP、A2A協(xié)議,正在做同樣一件事——只不過,這次連接的不只是機(jī)器,而是智能體。
我們正站在一個(gè)新世界的門口,眼前是一個(gè)尚未開拓的Agent 互聯(lián)網(wǎng)。
這片新大陸才剛剛開始被繪制。協(xié)議未定,標(biāo)準(zhǔn)未出,生態(tài)未穩(wěn)。但也正因?yàn)槿绱�,才是進(jìn)入的*時(shí)機(jī)。
這個(gè)時(shí)候,你可以選擇——
去理解MCP 協(xié)議的設(shè)計(jì)哲學(xué),而不是只學(xué)Prompt技巧;
去打造一個(gè)可復(fù)用、可組合、可協(xié)作的智能體,而不是再套一個(gè)UI殼;
去為這個(gè)未來寫下自己的代碼、構(gòu)建自己的節(jié)點(diǎn)、定義自己的協(xié)議。
正如當(dāng)年構(gòu)建Web 1.0的那批程序員,誰能想到,他們定義了后來全球人類的生活方式?
如果說過去的AI是“一個(gè)人會(huì)說話”,那么未來的AI是“一個(gè)系統(tǒng)能辦事”。誰能構(gòu)建那個(gè)能辦事、愿被信任、運(yùn)行高效的系統(tǒng),誰就能贏得下一個(gè)十年的AI底座之戰(zhàn)。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...