bb-browser:你的浏览器就是API,5K+Star的AI浏览器神器
GitHub: https://github.com/epiral/bb-browser
适配器仓库: https://github.com/epiral/bb-sites
Stars: 5000+
协议: 开源
发布平台: 程序员茄子(chenxutan.com)
标签: AI浏览器, CDP, MCP集成, Claude Code, Cursor, 爬虫替代
引言
让 AI 联网拿数据,比想象中难多了。
GitHub 的 REST API 有频率限制,Stack Overflow 的 API 要申请 key,知乎根本没有公开 API。
要么手动复制粘贴,要么让 Agent 去抓网页 HTML 再自己解析,又慢又乱。
bb-browser 来了。
一句话讲清楚:你的浏览器就是 API。不需要密钥,不需要爬虫,不需要模拟。
它让 AI Agent 直接使用你已经登录的真实 Chrome 浏览器,把各种网站当 API 用。
一、项目简介
bb-browser(BadBoy Browser)是一个开源的 AI 浏览器工具,让 AI Agent 借助你的真实浏览器访问互联网。
核心数据
| 指标 | 数值 |
|---|---|
| GitHub Star | 5000+ |
| 支持平台 | 36 个 |
| 可用命令 | 103 条 |
| 登录态 | 使用你自己的 |
支持的平台
目前社区维护的覆盖范围:
| 类别 | 平台 | 可用命令 |
|---|---|---|
| 搜索引擎 | Google、百度、Bing、DuckDuckGo、搜狗微信 | search |
| 社交媒体 | Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑 | search、feed、thread、user、hot |
| 新闻资讯 | BBC、Reuters、36氪、今日头条、东方财富 | headlines、newsflash、hot |
| 技术开发 | GitHub、StackOverflow、HackerNews、CSDN、博客园、V2EX、arXiv、npm、PyPI | search、issues、repo、thread、package |
| 视频平台 | YouTube、B站 | search、transcript、popular、comments |
| 影音娱乐 | 豆瓣、IMDb、起点中文网 | movie、search、top250 |
| 财经股票 | 雪球、东方财富、Yahoo Finance | stock、hot-stock、watchlist |
| 求职招聘 | BOSS直聘、LinkedIn | search、detail |
| 知识百科 | Wikipedia、知乎、Open Library | search、summary、hot |
| 购物比价 | 什么值得买 | search |
| 实用工具 | 有道翻译、GSMArena、Product Hunt、携程 | translate、手机参数 |
二、它的思路,和别人不一样
传统方案的问题
做过爬虫或者浏览器自动化的朋友应该懂,这块有几个老大难问题:
Playwright / Selenium
# 开的是无头浏览器,跟你现在登着的账号完全隔离
browser = playwright.chromium.launch(headless=True)
问题:
- Twitter 的 CSRF token、知乎的登录验证,全得重新搞一遍
- 很容易被识别为机器人
- 无法使用你的登录态
爬虫库
# 没有浏览器环境,只能模拟 HTTP 请求
response = requests.get(url, headers=headers)
问题:
- 反爬一升级就凉
- 到处是猫鼠游戏
- 复杂的鉴权无法处理
bb-browser 的思路
不让网站适配机器,而是让机器用人的界面。
具体来说:
- 通过 Chrome 扩展 + CDP WebSocket 协议直接连到你正在跑的 Chrome
- 在你的浏览器 tab 里执行
eval - 用你的 Cookie 直接调用
fetch() - 或者干脆注入页面的 webpack 模块来调用网站自己的内部方法
网站看到的是什么?是一个正常登录的用户在正常操作。因为,就是你。
三、对比
| 对比项 | Playwright / Selenium | 爬虫库 | bb-browser |
|---|---|---|---|
| 浏览器 | 无头、隔离环境 | 无浏览器 | 你的真实 Chrome |
| 登录态 | 没有,要重新登录 | 偷 Cookie | 已经在了 |
| 反爬检测 | 容易被识别 | 猫鼠游戏 | 无法检测,它就是用户 |
| 复杂鉴权 | 无法复制 | 需要逆向 | 页面自己处理 |
| 使用门槛 | 中等 | 高 | 低 |
四、安装配置
第一步:全局安装 CLI 工具
npm install -g bb-browser
第二步:安装 Chrome 扩展
- 从项目仓库下载 Chrome 扩展目录
- 打开
chrome://extensions - 开启开发者模式
- 点「Load unpacked」加载进去
扩展是 bb-browser 连接你真实浏览器的桥梁,这一步不能跳。
第三步:拉取社区适配器
bb-browser site update
这条命令会把社区维护的网站适配器同步到本地。
五、基本使用
常用命令示例
# 知乎热榜
bb-browser site zhihu/hot
# GitHub 仓库信息
bb-browser site github/repo epiral/bb-browser
# 搜职位
bb-browser site boss/search "AI engineer"
# YouTube 字幕全文
bb-browser site youtube/transcript VIDEO_ID
JSON 输出
所有命令输出都是结构化 JSON:
# 指定 JSON 输出
bb-browser site github/repo epiral/bb-browser --json
# jq 内联过滤
bb-browser site xueqiu/hot-stock 5 --jq '.items[] | {name, changePercent}'
输出示例:
{"name":"云天化","changePercent":"2.08%"}
{"name":"东芯股份","changePercent":"-7.60%"}
结果直接是干净的 JSON,传给后续的 Agent 或者脚本都很方便。
六、接入 Claude Code 和 Cursor
bb-browser 支持 MCP(Model Context Protocol) 接入。
配置方法
在 Claude Code 或 Cursor 的配置文件中添加:
{
"mcpServers": {
"bb-browser": {
"command": "npx",
"args": ["-y", "bb-browser", "--mcp"]
}
}
}
之后你可以
"帮我搜 Twitter 上某个话题最近的讨论"
"去 arXiv 检索论文:LLM fine-tuning"
"拉 GitHub 上某个项目的 issues"
"查 Stack Overflow 某个问题的答案"
这些以前要么靠 API key、要么靠手动,现在 Agent 自己就能搞定。
七、OpenClaw 集成
如果你在用 OpenClaw,还有个更省事的方式:
不需要装 Chrome 扩展,bb-browser 直接跑在 OpenClaw 的内置浏览器里:
bb-browser site reddit/hot --openclaw
bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'
八、底层架构
AI Agent(Claude Code、Codex、Cursor 等)
│ CLI 或 MCP(stdio)
▼
bb-browser CLI ──HTTP──▶ Daemon ──CDP WebSocket──▶ 你的真实浏览器
│
┌──────┴──────┐
│ Per-tab │
│ 事件缓存 │
│ (network, │
│ console, │
│ errors) │
└─────────────┘
组件说明
| 组件 | 说明 |
|---|---|
| CLI / MCP | AI Agent 的接口 |
| bb-browser CLI | 命令行工具 |
| Daemon | 本地守护进程,默认 127.0.0.1:19824 |
| CDP WebSocket | Chrome DevTools Protocol 连接 |
| 事件缓存 | 每个 tab 独立的 network/console/errors 缓存 |
远程调用
Daemon 默认绑定 127.0.0.1:19824,也可以改成监听 0.0.0.0,配合 Tailscale 或 ZeroTier 就能远程调用自己机器上的浏览器。
九、10 分钟把任何网站 CLI 化
这个功能我觉得挺有意思,而且项目组测试过:
你跟 Agent 说「帮我把 XX 网站 CLI 化」,它会自己读项目里的 guide,用
network --with-body抓包逆向,写 adapter,测试,然后提 PR 到社区仓库。
全程不用你盯着。
适配器复杂度分级
| 层级 | 认证方式 | 代表网站 | 耗时 |
|---|---|---|---|
| Tier 1 | Cookie(直接 fetch) | Reddit、GitHub、V2EX | 约 1 分钟 |
| Tier 2 | Bearer + CSRF token | Twitter、知乎 | 约 3 分钟 |
| Tier 3 | Webpack 注入 / Pinia store | Twitter 搜索、小红书 | 约 10 分钟 |
实测数据
20 个 AI Agent 并发运行,每个独立逆向一个网站,产出可用的 adapter。
把一个新网站纳入 Agent 可访问范围的成本已经压得很低了。
十、适配器仓库
这套平台列表背后有个配套仓库叫 bb-sites,每个命令就是一个独立的 JS 文件,社区驱动维护。
- 地址: https://github.com/epiral/bb-sites
- 贡献方式: AI Agent 自动生成 → 测试 → PR
十一、使用场景
| 场景 | 命令示例 |
|---|---|
| 调研任务 | 搜 Twitter 话题讨论、arXiv 论文检索 |
| 竞品分析 | GitHub issues 趋势、Product Hunt 新产品 |
| 股票查询 | 雪球热榜、东方财富行情 |
| 职位搜索 | BOSS直聘搜索、LinkedIn 查询 |
| 内容创作 | 小红书热榜、知乎热榜 |
| 技术问题 | Stack Overflow 答案、V2EX 帖子 |
十二、注意事项
使用前提
| 条件 | 说明 |
|---|---|
| Chrome 运行 | 依赖你的 Chrome 保持运行 |
| Daemon 常驻 | 需要后台进程 |
| 网络稳定 | 如果浏览器关了或者网络切了,就断了 |
安全考虑
本质上是在你的浏览器里执行代码,如果接入的是第三方 Agent,需要自己评估一下信任边界。
建议:
- 只接入信任的 Agent
- 定期检查浏览器扩展权限
- 不在公共机器上使用
十三、总结
核心价值
| 价值 | 说明 |
|---|---|
| 零 API Key | 不需要任何密钥 |
| 零爬虫 | 不需要逆向 HTTP |
| 零模拟 | 不需要模拟登录 |
| 真实登录态 | 用你自己的浏览器 |
| 无法被检测 | 它就是用户本人 |
适用人群
| 人群 | 适用度 |
|---|---|
| Claude Code / Cursor 用户 | ⭐⭐⭐⭐⭐ 完美 |
| 需要联网调研的 Agent | ⭐⭐⭐⭐⭐ 完美 |
| 爬虫开发者 | ⭐⭐⭐⭐ 很好 |
| 数据分析师 | ⭐⭐⭐⭐ 很好 |
核心洞察
AI Agent 落地最大的卡点之一,就是「信息获取」——Agent 能写代码、能跑命令,但它看不到互联网上正在发生的事情,或者看到的太滞后、太残缺。
没有 bb-browser 的时候,AI Agent 的世界基本上是:文件 + 终端 + 少数有 API key 的服务。
有了 bb-browser,多了整个互联网。
本文首发于「程序员茄子」博客,原文链接:https://chenxutan.com