WebMCP 是 Google Chrome 團隊近期提出的新概念,核心想法是讓網站像提供 API 一樣,主動把自己的功能清單交給 AI Agent,而不是讓 Agent 靠猜測去操作畫面。這對網站設計、自動化流程與 AI 工程師的工作方式都可能產生深遠影響,也是我今天學習筆記想整理的主題。
本文重點快速看
- WebMCP 想讓網站主動暴露功能,而非讓 AI Agent 盲猜畫面。
- 現行網頁自動化高度依賴 HTML 解析、無障礙樹與截圖猜測。
- 廣告與動態版面常讓傳統自動化流程不穩定。
- WebMCP 的方向類似把網站變成可呼叫的 API 集合。
- 目前仍是早期概念,實作細節與生態系尚未成熟。
WebMCP 到底是什麼?為什麼值得注意?
WebMCP 的精神是讓網站像提供 API 一樣,主動把自己的功能清單交給 AI Agent。對 AI 工程師來說,這代表未來設計網站時,可能要把「可被 Agent 呼叫」當成基礎需求,而不是附加功能。
現在的 AI Agent 操作網頁為什麼這麼脆弱?
目前的網頁自動化流程高度依賴解析整頁 HTML、爬無障礙樹,有時還得截圖來猜按鈕位置。一旦廣告載入、版面滑動或元件位置改變,整個流程就很容易失敗。這不是真正的自動化,更像是賭運氣。
| 面向 | 傳統網頁自動化 | WebMCP 概念方向 |
|---|---|---|
| 互動依據 | HTML、無障礙樹、截圖猜測 | 網站主動暴露的功能清單 |
| 穩定度 | 受版面與廣告影響大 | 由結構化介面決定,較穩定 |
| 設計思維 | 以人類視覺為主 | 同時考慮人類與 Agent |
WebMCP 對網站設計與自動化流程意味著什麼?
如果網站像 API 一樣提供功能清單,AI Agent 就能像呼叫工具一樣直接執行任務,例如購票、查詢、提交表單,而不必從零猜測畫面結構。這會把網站設計從「給人看」延伸到「給 Agent 用」,也可能改變未來十年的網站設計邏輯。
常見問題 FAQ
WebMCP 是一個已經上線的標準嗎?
目前仍屬於早期概念階段,實作細節、生態系與瀏覽器支援都尚未成熟,實際導入前需要持續觀察。
WebMCP 會取代現有的網頁自動化工具嗎?
短期內不會完全取代,因為現行工具仍需處理大量既有網站;但長期可能成為新網站的設計預設。
一般開發者現在需要學 WebMCP 嗎?
可以先理解概念與設計思維,把它當作未來網站架構的參考方向,不必急著投入完整實作。
WebMCP 跟傳統 API 有什麼差別?
傳統 API 通常由後端提供給開發者;WebMCP 的方向是讓前端網站主動向 AI Agent 暴露可呼叫的功能,兩者層級與對象不同。
結語
今天的學習重點是 WebMCP 試圖把網站變成可呼叫的工具集合,減少 AI Agent 對畫面猜測的依賴。雖然目前仍是早期概念,但這個方向提醒我們,未來的網站設計可能需要同時考慮人類使用者與 AI Agent,這也是值得持續追蹤的工程趨勢。
延伸參考資料
- Model Context Protocol 官方文件:Architecture overview理解 MCP 如何把外部資料、工具與 AI 應用連接起來的基礎參考。
- HyperFrames GitHub RepositoryHeyGen 開源的 HTML-to-video 框架,適合延伸閱讀 agent 生成影片工作流。
- Chromium 官方開發者文件理解 Chromium 架構、開發流程與瀏覽器底層行為的入口。

