使用 Playwright MCP Server 为你的 AI Agent 赋予浏览器自动化能力

B站影视 内地电影 2025-10-14 19:40 1

摘要:你是否曾经希望你的AI助手不仅能回答问题,还能真正帮你操作网页——自动填写表单、抓取数据、执行重复性任务?现在,通过Playwright MCP Server,这一切都成为了可能。

你是否曾经希望你的AI助手不仅能回答问题,还能真正帮你操作网页——自动填写表单、抓取数据、执行重复性任务?现在,通过 Playwright MCP Server,这一切都成为了可能。

本文将带你从零开始,一步步将浏览器自动化能力赋予你的AI Agent,让它从一个被动的知识库转变为一个能主动执行任务的数字助手。

MCP是Anthropic推出的一个开放协议,它允许AI模型安全、可控地访问外部工具和数据源。你可以把它想象成AI的"USB接口"——通过标准化的方式连接各种外部能力。

Playwright是一个现代化的浏览器自动化库,支持Chrome、Firefox、Safari等主流浏览器。它比传统的Selenium更快速、更可靠,特别适合处理现代Web应用。

这就是连接AI与浏览器的桥梁!它是一个实现了MCP协议的服务器,将Playwright的浏览器操作能力"暴露"给AI模型,让AI能够:

Playwright MCP Server基于Node.js开发,首先需要安装运行环境:

访问 Node.js官网下载并安装LTS版本(推荐18.x或更高)验证安装:# 克隆仓库git clone https://github.com/anthropics/anthropic-mcp-playwrightcd anthropic-mcp-playwright# 安装依赖npm install# 安装Playwright浏览器npx playwright install

如果你使用Claude Desktop,配置非常简单:

macOS: ~/Library/Application Support/Claude/Windows: %APPDATA%\Claude\Linux: ~/.config/Claude/

创建或编辑配置文件 claude_desktop_config.json:

{"mcpServers": {"playwright": {"command": "node","args": ["/绝对路径/anthropic-mcp-playwright/dist/index.js"],"env": {"BROWSER": "chromium"}}}}

注意:请将 /绝对路径/ 替换为你实际克隆仓库的路径。

重启Claude Desktop,大功告成!

重启后,在Claude的对话界面中,你可以尝试询问:

"你现在有哪些可用的工具?"

Claude应该会回复它现在可以使用的Playwright工具列表,包括:

让我们从一个简单的例子开始,感受AI自动化的魅力。

你的指令

"请打开百度首页 (https://www.baidu.com),在搜索框里输入'北京天气',然后搜索。"

Claude的执行过程

理解指令:Claude识别出需要执行浏览器操作调用工具:自动选择并调用相应的MCP工具执行序列:使用 navigate 工具打开百度使用 click_and_fill 工具在搜索框输入"北京天气"使用 click 工具点击搜索按钮返回结果:页面加载后,Claude会读取搜索结果并总结天气信息

整个过程完全自动化!你不需要手动操作浏览器,也不需要复制粘贴任何内容。

现在你的AI Agent已经具备了以下超能力:

基础导航操作内容获取extract_text(selector) - 提取特定元素的文本get_page_content - 获取整个页面的文本内容等待与状态管理

指令

"去豆瓣电影Top250页面 (https://movie.douban.com/top250),提取前5部电影的名称和评分,整理成表格。"

指令

"打开一个练习用的注册页面,帮我填写测试用户信息:用户名testuser,邮箱test@example.com,密码Password123。"

指令

"先登录到我的测试系统(账号: demo, 密码: demo),然后导航到用户管理页面,创建一个新用户'john_doe'。"

AI通常会自动选择合适的选择器,但你可以指导它:

"使用包含'登录'文本的按钮""通过ID定位搜索框"错误处理

当操作失败时:

让AI分析错误原因尝试替代方案调整等待时间或选择器

来源:阿康聊科技

相关推荐