编程 Kimi-WebBridge:让 AI Agent 直接操控你的浏览器

2026-06-04 08:04:00 +0800 CST views 8

Kimi-WebBridge:让 AI Agent 直接操控你的浏览器

在 AI Agent 大爆发的时代,如何让 AI 真正「动手」操作浏览器,一直是个痛点。市面上的方案不少——Playwright、Selenium、Puppeteer——但它们都要启动一个全新的浏览器实例,你的登录状态、Cookie、Session 全部丢失。想自动发个帖子?先让 AI 帮你登录一遍吧。

Kimi-WebBridge 走了一条不同的路:它直接操控你正在使用的浏览器,登录态天然复用,操作即所见即所得。


它是什么?

Kimi-WebBridge 是月之暗面(Moonshot AI)推出的一款浏览器插件 + 本地桥接服务的组合工具,专为 AI Agent 设计。

简单理解架构:

AI Agent(如 Kimi)→ 本地桥接服务 → 浏览器扩展 → 你正在用的 Chrome/Edge

Agent 把指令发给桥接服务,扩展基于 Chrome DevTools Protocol(CDP) 在你当前浏览器里完成导航、点击、截图、读取页面等操作,再把结果回传给 Agent。

关键点:所有执行都在你本地完成,登录态和网页内容不会离开你的设备。


跟传统方案比,强在哪?

对比维度Playwright / SeleniumKimi-WebBridge
浏览器实例启动全新无头浏览器复用你当前的浏览器
登录状态需要重新登录天然继承,无需额外处理
安装复杂度需要 npm/pip 安装 + WebDriver装个浏览器插件即可
运行方式后台无头前台可见,所见即所得
适用场景自动化测试、爬虫日常浏览器操作自动化

最核心的差异就一个字:你的浏览器。不是新开一个,是直接接管你正在用的那个。


安装步骤

1. 安装浏览器插件

两种方式任选:

  • Chrome 应用商店直接安装:访问 Kimi WebBridge 页面,点击下载
  • 手动安装:下载 CRX 文件,在 chrome://extensions 页面开启开发者模式,拖入安装

安装成功后浏览器工具栏会多一个 Kimi WebBridge 图标。

2. 让 AI Agent 连接 WebBridge

在 Kimi 对话中发送连接指令即可。连接成功后,浏览器插件图标会显示绿色状态。

3. 开始使用

直接用自然语言告诉 AI 你想做什么:

用我的浏览器打开掘金,帮我发一条沸点:Kimi-WebBridge 挺好用的

AI 会自动完成:打开网页 → 定位输入框 → 输入内容 → 点击发布。


实际能做什么?

根据官方介绍和社区反馈,典型场景包括:

自动调研成文:让 Agent 帮你打开多个网页收集资料,自动整理成文章。

智能填写表单:自动识别页面表单,批量填写信息。比如批量提交报销单、填写问卷。

网页截图与信息提取:截取指定页面内容,提取关键数据。适合做竞品监控、价格追踪。

自动化操作流程:比如定期登录某个后台系统检查数据、下载报表。

量化策略回测:结合金融网站进行策略验证(官方示例场景之一)。


技术细节

  • 协议:基于 Chrome DevTools Protocol(CDP),这也是 Playwright、Puppeteer 底层使用的同一套协议
  • 通信架构:本地桥接服务(HTTP)+ 浏览器扩展(WebSocket),全本地通信
  • 安全性:数据不经过云端,所有操作在本地完成
  • 兼容性:支持 Chrome 和 Edge 浏览器

适用人群

  • AI Agent 开发者:想让 Agent 具备浏览器操作能力,但又不想折腾 Playwright 的
  • 重复操作苦手:每天要登录各种后台做重复操作的打工人
  • 内容创作者:需要跨平台发布内容的自媒体人
  • 数据采集需求:需要从已登录的网页提取信息的分析师

局限性

客观说几个不足:

  1. 绑定 Kimi 生态:目前主要配合 Kimi 使用,对其他 Agent 框架的兼容性有限
  2. 仅支持 Chromium:Chrome 和 Edge 可以,Safari 和 Firefox 暂不支持
  3. 需要桌面环境:不能在纯服务器/无头环境运行,必须有图形界面的浏览器
  4. 稳定性依赖网络:桥接服务是本地 HTTP 服务,端口冲突或权限问题可能导致连接失败
  5. 隐私考量:虽然官方说数据不出设备,但毕竟是接管了你整个浏览器的操作权限,需自行评估信任度

总结

Kimi-WebBridge 的核心价值很清晰:让 AI 操作你正在用的浏览器,而不是开一个新的。这个看似简单的差异,解决了一大类实际痛点——登录态复用。

如果你的工作流中有大量重复的浏览器操作,且恰好在使用 Kimi 作为 AI 助手,WebBridge 值得一试。它不是 Playwright 的替代品,而是面向不同场景的互补方案。


项目地址kimi.com/zh-cn/features/webbridge

复制全文 生成海报 AI 浏览器自动化 Kimi Agent

推荐文章

什么是Vue实例(Vue Instance)?
2024-11-19 06:04:20 +0800 CST
JavaScript设计模式:装饰器模式
2024-11-19 06:05:51 +0800 CST
如何在 Vue 3 中使用 Vuex 4?
2024-11-17 04:57:52 +0800 CST
底部导航栏
2024-11-19 01:12:32 +0800 CST
Nginx rewrite 的用法
2024-11-18 22:59:02 +0800 CST
在JavaScript中实现队列
2024-11-19 01:38:36 +0800 CST
Node.js中接入微信支付
2024-11-19 06:28:31 +0800 CST
Go语言SQL操作实战
2024-11-18 19:30:51 +0800 CST
程序员茄子在线接单