日常學習第832天：認識 WebMCP，讓網站像 API 一樣直接交給 AI Agent

WebMCP 是 Chrome 團隊提出的新概念，讓網站主動向 AI Agent 暴露功能清單。本文整理其核心精神、與傳統網頁自動化的差異，以及對未來網站設計與自動化流程可能帶來的影響。

WebMCP 是 Google Chrome 團隊近期提出的新概念，核心想法是讓網站像提供 API 一樣，主動把自己的功能清單交給 AI Agent，而不是讓 Agent 靠猜測去操作畫面。這對網站設計、自動化流程與 AI 工程師的工作方式都可能產生深遠影響，也是我今天學習筆記想整理的主題。

本文重點快速看

WebMCP 的精神是讓網站像提供 API 一樣，主動把自己的功能清單交給 AI Agent。對 AI 工程師來說，這代表未來設計網站時，可能要把「可被 Agent 呼叫」當成基礎需求，而不是附加功能。

目前的網頁自動化流程高度依賴解析整頁 HTML、爬無障礙樹，有時還得截圖來猜按鈕位置。一旦廣告載入、版面滑動或元件位置改變，整個流程就很容易失敗。這不是真正的自動化，更像是賭運氣。

如果網站像 API 一樣提供功能清單，AI Agent 就能像呼叫工具一樣直接執行任務，例如購票、查詢、提交表單，而不必從零猜測畫面結構。這會把網站設計從「給人看」延伸到「給 Agent 用」，也可能改變未來十年的網站設計邏輯。

目前仍屬於早期概念階段，實作細節、生態系與瀏覽器支援都尚未成熟，實際導入前需要持續觀察。

短期內不會完全取代，因為現行工具仍需處理大量既有網站；但長期可能成為新網站的設計預設。

可以先理解概念與設計思維，把它當作未來網站架構的參考方向，不必急著投入完整實作。

傳統 API 通常由後端提供給開發者；WebMCP 的方向是讓前端網站主動向 AI Agent 暴露可呼叫的功能，兩者層級與對象不同。

今天的學習重點是 WebMCP 試圖把網站變成可呼叫的工具集合，減少 AI Agent 對畫面猜測的依賴。雖然目前仍是早期概念，但這個方向提醒我們，未來的網站設計可能需要同時考慮人類使用者與 AI Agent，這也是值得持續追蹤的工程趨勢。

Model Context Protocol 官方文件：Architecture overview理解 MCP 如何把外部資料、工具與 AI 應用連接起來的基礎參考。
HyperFrames GitHub RepositoryHeyGen 開源的 HTML-to-video 框架，適合延伸閱讀 agent 生成影片工作流。
Chromium 官方開發者文件理解 Chromium 架構、開發流程與瀏覽器底層行為的入口。