编程 微软Playwright CLI:让AI帮你操作浏览器,TOKEN消耗降低4倍的秘密

2026-04-30 08:26:42 +0800 CST views 9

微软Playwright CLI:让AI帮你操作浏览器,TOKEN消耗降低4倍的秘密

你是否想过让AI帮你操作浏览器?无论是自动填表、批量抓取数据,还是把文章发布到各个平台,这些重复性的工作都可以交给AI来完成。今天我要介绍的,就是微软开源的全新浏览器自动化工具——Playwright CLI,它可以让你用自然语言指挥AI操作浏览器,而且特别省TOKEN。

根据官方实测,Playwright CLI比起传统的Playwright MCP方案,能够减少4倍的TOKEN消耗。这是什么概念?意味着同样的任务,用Playwright CLI成本只有原来的四分之一。

为什么需要浏览器自动化?

想象以下场景:

  • 批量抓取电商评论:你需要查看100条商品评价,导出成CSV文件
  • 自动发布文章:把Markdown文章发布到多个平台,每个平台都要手动上传图片
  • AI自动化测试:对自己开发的Web APP进行功能测试,每次更新都要人工测试

这些工作都很枯燥,而且是重复性的。浏览器自动化的目的,就是让AI代替你完成这些机械性的操作,你只需要下指令就够了。

而且,很多工作流甚至全程不需要AI参与,0 TOKEN就能把自动化任务跑起来。

Playwright CLI 是什么?

Playwright CLI是微软在2026年初开源的全新浏览器自动化命令行工具。它的核心思想是按需加载——AI需要多少信息,就读取多少,而不是像传统MCP那样把整个网页内容都塞进上下文。

官方GitHub首页:https://github.com/microsoft/playwright-cli

环境准备

在开始之前,你需要准备好以下环境:

1. 安装Node.js

如果没有安装过Node.js,可以来到Node.js官网下载:
https://nodejs.org/en/download

根据你的操作系统选择对应的安装包,Windows用户下载.msi包,Mac用户下载.pkg包。

2. 安装Playwright CLI

打开终端(Windows用户用PowerShell或CMD,Mac用户用Terminal),输入以下命令:

npm install -g playwright-cli

安装完成后,你可以用这个命令验证:

playwright-cli --version

3. 安装Chrome浏览器

建议使用Chrome浏览器,Edge也可以,但Chrome兼容性和稳定性更好。

基础使用

打开网页

最基本的命令,就是让Playwright CLI打开一个网页:

playwright-cli open google.com --headed

--headed参数表示使用有头浏览器,可以看到浏览器窗口。如果不加这个参数,默认使用无头浏览器,在后台静默运行。

首次运行会自动下载Chrome driver,耐心等待一下。

读取网页内容

Playwright CLI默认只输出简洁的网页摘要,不会返回整个DOM结构。

如果需要更详细的信息,可以读取快照文件。AI会按需读取,不会把所有内容都塞进上下文——这就是省TOKEN的秘密。

playwright-cli screenshot

截图会保存为PNG文件到本地磁盘,由AI决定是否读取。

保存登录状态

--persistent参数可以保存cookie和登录状态,下次使用不需要重新登录:

playwright-cli open google.com --headed --persistent

因为之前登录过,第二次打开就会直接显示登录状态。

接入AI Agent

Playwright CLI需要搭配skills才能让AI正确使用。

安装Skills

playwright-cli install --skills

这会把skills安装到项目目录下的.claude文件夹。

配合Claude Code使用

启动Claude Code后,询问它有哪些skills,它就能读取到Playwright CLI技能。

配合Codex使用

把skills文件夹名字从.claude改成.codex来适配Codex。

输入/skills命令可以看到Playwright CLI已经配置完成。

进阶实战:从抓取评论到自动发布

案例1:抓取商品评论

让AI抓取商品前100条评论,保存到CSV文件:

  1. AI先学习Playwright CLI技能
  2. 打开商品页
  3. 探索并解决遇到的问题
  4. 执行JavaScript获取评论
  5. 保存成CSV文件

第一次执行往往会磕磕绊绊,用掉较多TOKEN。但让AI把过程提炼成skill后,第二次执行会非常丝滑,TOKEN消耗降低10倍

案例2:完全固定脚本

如果一个流程是完全固定的(比如抓取评论),甚至可以把整个过程写成脚本,0 TOKEN就能完成任务。

编写好脚本后,直接执行:

./脚本路径.ps1

中间不需要任何AI参与。

自动发布文章实战

把Markdown文章发布到X平台是很多创作者的痛点:

  • Markdown格式直接粘贴会乱码
  • 图片需要手动一张张上传

使用Playwright CLI + Codex可以自动化这个流程:

  1. 编写Python脚本下载文章图片,按编号保存
  2. 转换成HTML格式
  3. 让AI自动打开X平台,创建新文章
  4. 自动粘贴内容,自动上传图片替换占位符

,把整个流程固化后,以後只需要给AI一个文章路径,它就能自动完成发布。

这个自动化方案的源代码已经开源:https://github.com/tech-shrimp/x-article-auto-publisher-skill

AI自动化测试

浏览器自动化的另一个重要应用是对自己开发的Web APP进行自动化测试。

流程:

  1. 让AI阅读项目代码
  2. 编写测试文档
  3. 使用Playwright CLI自动执行测试
  4. 生成测试报告

使用OpenClaw这种带定时任务的框架,还可以让AI定时自动测试系统,一旦发现bug就会自动通知你,省去人工测试的成本。

总结

Playwright CLI的核心优势:

  • 按需加载:只读取AI需要的信息,不把整个网页塞进上下文
  • 省TOKEN:官方数据可减少4倍TOKEN消耗
  • 0 TOKEN自动化:固定流程可以直接写成脚本执行
  • 自然语言控制:用自然语言就能指挥AI操作浏览器
  • 多框架兼容:支持Claude Code、Codex、OpenClaw等主流框架

最佳实践

  1. 准备阶段:安装Node.js、Playwright CLI、Chrome浏览器
  2. 接入AI:把skills安装进你使用的Agent框架
  3. 让AI摸索:给一个复杂任务,让AI自己探索执行
  4. 提炼skill:把执行过程提炼成skill,避免踩坑
  5. 固化脚本:如果流程完全固定,直接写成脚本,0 TOKEN执行

通过这套流程,你可以把各种浏览器操作自动化,让AI帮你完成那些繁琐的重复性工作。


来源:微信公众号本文转载,已获得授权

复制全文 生成海报 AI 自动化 Tools

推荐文章

FcDesigner:低代码表单设计平台
2024-11-19 03:50:18 +0800 CST
html5在客户端存储数据
2024-11-17 05:02:17 +0800 CST
前端代码规范 - 图片相关
2024-11-19 08:34:48 +0800 CST
Flet 构建跨平台应用的 Python 框架
2025-03-21 08:40:53 +0800 CST
Nginx 负载均衡
2024-11-19 10:03:14 +0800 CST
支付轮询打赏系统介绍
2024-11-18 16:40:31 +0800 CST
15 个 JavaScript 性能优化技巧
2024-11-19 07:52:10 +0800 CST
Go 协程上下文切换的代价
2024-11-19 09:32:28 +0800 CST
Golang - 使用 GoFakeIt 生成 Mock 数据
2024-11-18 15:51:22 +0800 CST
程序员茄子在线接单