微软Playwright CLI:让AI帮你操作浏览器,TOKEN消耗降低4倍的秘密
你是否想过让AI帮你操作浏览器?无论是自动填表、批量抓取数据,还是把文章发布到各个平台,这些重复性的工作都可以交给AI来完成。今天我要介绍的,就是微软开源的全新浏览器自动化工具——Playwright CLI,它可以让你用自然语言指挥AI操作浏览器,而且特别省TOKEN。
根据官方实测,Playwright CLI比起传统的Playwright MCP方案,能够减少4倍的TOKEN消耗。这是什么概念?意味着同样的任务,用Playwright CLI成本只有原来的四分之一。
为什么需要浏览器自动化?
想象以下场景:
- 批量抓取电商评论:你需要查看100条商品评价,导出成CSV文件
- 自动发布文章:把Markdown文章发布到多个平台,每个平台都要手动上传图片
- AI自动化测试:对自己开发的Web APP进行功能测试,每次更新都要人工测试
这些工作都很枯燥,而且是重复性的。浏览器自动化的目的,就是让AI代替你完成这些机械性的操作,你只需要下指令就够了。
而且,很多工作流甚至全程不需要AI参与,0 TOKEN就能把自动化任务跑起来。
Playwright CLI 是什么?
Playwright CLI是微软在2026年初开源的全新浏览器自动化命令行工具。它的核心思想是按需加载——AI需要多少信息,就读取多少,而不是像传统MCP那样把整个网页内容都塞进上下文。
官方GitHub首页:https://github.com/microsoft/playwright-cli
环境准备
在开始之前,你需要准备好以下环境:
1. 安装Node.js
如果没有安装过Node.js,可以来到Node.js官网下载:
https://nodejs.org/en/download
根据你的操作系统选择对应的安装包,Windows用户下载.msi包,Mac用户下载.pkg包。
2. 安装Playwright CLI
打开终端(Windows用户用PowerShell或CMD,Mac用户用Terminal),输入以下命令:
npm install -g playwright-cli
安装完成后,你可以用这个命令验证:
playwright-cli --version
3. 安装Chrome浏览器
建议使用Chrome浏览器,Edge也可以,但Chrome兼容性和稳定性更好。
基础使用
打开网页
最基本的命令,就是让Playwright CLI打开一个网页:
playwright-cli open google.com --headed
--headed参数表示使用有头浏览器,可以看到浏览器窗口。如果不加这个参数,默认使用无头浏览器,在后台静默运行。
首次运行会自动下载Chrome driver,耐心等待一下。
读取网页内容
Playwright CLI默认只输出简洁的网页摘要,不会返回整个DOM结构。
如果需要更详细的信息,可以读取快照文件。AI会按需读取,不会把所有内容都塞进上下文——这就是省TOKEN的秘密。
playwright-cli screenshot
截图会保存为PNG文件到本地磁盘,由AI决定是否读取。
保存登录状态
--persistent参数可以保存cookie和登录状态,下次使用不需要重新登录:
playwright-cli open google.com --headed --persistent
因为之前登录过,第二次打开就会直接显示登录状态。
接入AI Agent
Playwright CLI需要搭配skills才能让AI正确使用。
安装Skills
playwright-cli install --skills
这会把skills安装到项目目录下的.claude文件夹。
配合Claude Code使用
启动Claude Code后,询问它有哪些skills,它就能读取到Playwright CLI技能。
配合Codex使用
把skills文件夹名字从.claude改成.codex来适配Codex。
输入/skills命令可以看到Playwright CLI已经配置完成。
进阶实战:从抓取评论到自动发布
案例1:抓取商品评论
让AI抓取商品前100条评论,保存到CSV文件:
- AI先学习Playwright CLI技能
- 打开商品页
- 探索并解决遇到的问题
- 执行JavaScript获取评论
- 保存成CSV文件
第一次执行往往会磕磕绊绊,用掉较多TOKEN。但让AI把过程提炼成skill后,第二次执行会非常丝滑,TOKEN消耗降低10倍。
案例2:完全固定脚本
如果一个流程是完全固定的(比如抓取评论),甚至可以把整个过程写成脚本,0 TOKEN就能完成任务。
编写好脚本后,直接执行:
./脚本路径.ps1
中间不需要任何AI参与。
自动发布文章实战
把Markdown文章发布到X平台是很多创作者的痛点:
- Markdown格式直接粘贴会乱码
- 图片需要手动一张张上传
使用Playwright CLI + Codex可以自动化这个流程:
- 编写Python脚本下载文章图片,按编号保存
- 转换成HTML格式
- 让AI自动打开X平台,创建新文章
- 自动粘贴内容,自动上传图片替换占位符
,把整个流程固化后,以後只需要给AI一个文章路径,它就能自动完成发布。
这个自动化方案的源代码已经开源:https://github.com/tech-shrimp/x-article-auto-publisher-skill
AI自动化测试
浏览器自动化的另一个重要应用是对自己开发的Web APP进行自动化测试。
流程:
- 让AI阅读项目代码
- 编写测试文档
- 使用Playwright CLI自动执行测试
- 生成测试报告
使用OpenClaw这种带定时任务的框架,还可以让AI定时自动测试系统,一旦发现bug就会自动通知你,省去人工测试的成本。
总结
Playwright CLI的核心优势:
- 按需加载:只读取AI需要的信息,不把整个网页塞进上下文
- 省TOKEN:官方数据可减少4倍TOKEN消耗
- 0 TOKEN自动化:固定流程可以直接写成脚本执行
- 自然语言控制:用自然语言就能指挥AI操作浏览器
- 多框架兼容:支持Claude Code、Codex、OpenClaw等主流框架
最佳实践
- 准备阶段:安装Node.js、Playwright CLI、Chrome浏览器
- 接入AI:把skills安装进你使用的Agent框架
- 让AI摸索:给一个复杂任务,让AI自己探索执行
- 提炼skill:把执行过程提炼成skill,避免踩坑
- 固化脚本:如果流程完全固定,直接写成脚本,0 TOKEN执行
通过这套流程,你可以把各种浏览器操作自动化,让AI帮你完成那些繁琐的重复性工作。
来源:微信公众号本文转载,已获得授权