案例 bb-browser:你的浏览器就是API,5K+Star的AI浏览器神器

2026-05-06 23:11:21 +0800 CST views 7

bb-browser:你的浏览器就是API,5K+Star的AI浏览器神器

GitHub: https://github.com/epiral/bb-browser
适配器仓库: https://github.com/epiral/bb-sites
Stars: 5000+
协议: 开源
发布平台: 程序员茄子(chenxutan.com)
标签: AI浏览器, CDP, MCP集成, Claude Code, Cursor, 爬虫替代


引言

让 AI 联网拿数据,比想象中难多了。

GitHub 的 REST API 有频率限制,Stack Overflow 的 API 要申请 key,知乎根本没有公开 API。

要么手动复制粘贴,要么让 Agent 去抓网页 HTML 再自己解析,又慢又乱。

bb-browser 来了。

一句话讲清楚:你的浏览器就是 API。不需要密钥,不需要爬虫,不需要模拟。

它让 AI Agent 直接使用你已经登录的真实 Chrome 浏览器,把各种网站当 API 用。


一、项目简介

bb-browser(BadBoy Browser)是一个开源的 AI 浏览器工具,让 AI Agent 借助你的真实浏览器访问互联网。

核心数据

指标数值
GitHub Star5000+
支持平台36 个
可用命令103 条
登录态使用你自己的

支持的平台

目前社区维护的覆盖范围:

类别平台可用命令
搜索引擎Google、百度、Bing、DuckDuckGo、搜狗微信search
社交媒体Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑search、feed、thread、user、hot
新闻资讯BBC、Reuters、36氪、今日头条、东方财富headlines、newsflash、hot
技术开发GitHub、StackOverflow、HackerNews、CSDN、博客园、V2EX、arXiv、npm、PyPIsearch、issues、repo、thread、package
视频平台YouTube、B站search、transcript、popular、comments
影音娱乐豆瓣、IMDb、起点中文网movie、search、top250
财经股票雪球、东方财富、Yahoo Financestock、hot-stock、watchlist
求职招聘BOSS直聘、LinkedInsearch、detail
知识百科Wikipedia、知乎、Open Librarysearch、summary、hot
购物比价什么值得买search
实用工具有道翻译、GSMArena、Product Hunt、携程translate、手机参数

二、它的思路,和别人不一样

传统方案的问题

做过爬虫或者浏览器自动化的朋友应该懂,这块有几个老大难问题:

Playwright / Selenium

# 开的是无头浏览器,跟你现在登着的账号完全隔离
browser = playwright.chromium.launch(headless=True)

问题:

  • Twitter 的 CSRF token、知乎的登录验证,全得重新搞一遍
  • 很容易被识别为机器人
  • 无法使用你的登录态

爬虫库

# 没有浏览器环境,只能模拟 HTTP 请求
response = requests.get(url, headers=headers)

问题:

  • 反爬一升级就凉
  • 到处是猫鼠游戏
  • 复杂的鉴权无法处理

bb-browser 的思路

不让网站适配机器,而是让机器用人的界面。

具体来说:

  1. 通过 Chrome 扩展 + CDP WebSocket 协议直接连到你正在跑的 Chrome
  2. 在你的浏览器 tab 里执行 eval
  3. 用你的 Cookie 直接调用 fetch()
  4. 或者干脆注入页面的 webpack 模块来调用网站自己的内部方法

网站看到的是什么?是一个正常登录的用户在正常操作。因为,就是你。


三、对比

对比项Playwright / Selenium爬虫库bb-browser
浏览器无头、隔离环境无浏览器你的真实 Chrome
登录态没有,要重新登录偷 Cookie已经在了
反爬检测容易被识别猫鼠游戏无法检测,它就是用户
复杂鉴权无法复制需要逆向页面自己处理
使用门槛中等

四、安装配置

第一步:全局安装 CLI 工具

npm install -g bb-browser

第二步:安装 Chrome 扩展

  1. 从项目仓库下载 Chrome 扩展目录
  2. 打开 chrome://extensions
  3. 开启开发者模式
  4. 点「Load unpacked」加载进去

扩展是 bb-browser 连接你真实浏览器的桥梁,这一步不能跳。

第三步:拉取社区适配器

bb-browser site update

这条命令会把社区维护的网站适配器同步到本地。


五、基本使用

常用命令示例

# 知乎热榜
bb-browser site zhihu/hot

# GitHub 仓库信息
bb-browser site github/repo epiral/bb-browser

# 搜职位
bb-browser site boss/search "AI engineer"

# YouTube 字幕全文
bb-browser site youtube/transcript VIDEO_ID

JSON 输出

所有命令输出都是结构化 JSON:

# 指定 JSON 输出
bb-browser site github/repo epiral/bb-browser --json

# jq 内联过滤
bb-browser site xueqiu/hot-stock 5 --jq '.items[] | {name, changePercent}'

输出示例:

{"name":"云天化","changePercent":"2.08%"}
{"name":"东芯股份","changePercent":"-7.60%"}

结果直接是干净的 JSON,传给后续的 Agent 或者脚本都很方便。


六、接入 Claude Code 和 Cursor

bb-browser 支持 MCP(Model Context Protocol) 接入。

配置方法

在 Claude Code 或 Cursor 的配置文件中添加:

{
  "mcpServers": {
    "bb-browser": {
      "command": "npx",
      "args": ["-y", "bb-browser", "--mcp"]
    }
  }
}

之后你可以

"帮我搜 Twitter 上某个话题最近的讨论"
"去 arXiv 检索论文:LLM fine-tuning"
"拉 GitHub 上某个项目的 issues"
"查 Stack Overflow 某个问题的答案"

这些以前要么靠 API key、要么靠手动,现在 Agent 自己就能搞定。


七、OpenClaw 集成

如果你在用 OpenClaw,还有个更省事的方式:

不需要装 Chrome 扩展,bb-browser 直接跑在 OpenClaw 的内置浏览器里:

bb-browser site reddit/hot --openclaw

bb-browser site xueqiu/hot-stock 5 --openclaw --jq '.items[] | {name, changePercent}'

八、底层架构

AI Agent(Claude Code、Codex、Cursor 等)
       │ CLI 或 MCP(stdio)
       ▼
bb-browser CLI ──HTTP──▶ Daemon ──CDP WebSocket──▶ 你的真实浏览器
                          │
                   ┌──────┴──────┐
                   │  Per-tab    │
                   │  事件缓存   │
                   │  (network,  │
                   │   console,  │
                   │   errors)   │
                   └─────────────┘

组件说明

组件说明
CLI / MCPAI Agent 的接口
bb-browser CLI命令行工具
Daemon本地守护进程,默认 127.0.0.1:19824
CDP WebSocketChrome DevTools Protocol 连接
事件缓存每个 tab 独立的 network/console/errors 缓存

远程调用

Daemon 默认绑定 127.0.0.1:19824,也可以改成监听 0.0.0.0,配合 TailscaleZeroTier 就能远程调用自己机器上的浏览器。


九、10 分钟把任何网站 CLI 化

这个功能我觉得挺有意思,而且项目组测试过:

你跟 Agent 说「帮我把 XX 网站 CLI 化」,它会自己读项目里的 guide,用 network --with-body 抓包逆向,写 adapter,测试,然后提 PR 到社区仓库。

全程不用你盯着。

适配器复杂度分级

层级认证方式代表网站耗时
Tier 1Cookie(直接 fetch)Reddit、GitHub、V2EX约 1 分钟
Tier 2Bearer + CSRF tokenTwitter、知乎约 3 分钟
Tier 3Webpack 注入 / Pinia storeTwitter 搜索、小红书约 10 分钟

实测数据

20 个 AI Agent 并发运行,每个独立逆向一个网站,产出可用的 adapter。

把一个新网站纳入 Agent 可访问范围的成本已经压得很低了。


十、适配器仓库

这套平台列表背后有个配套仓库叫 bb-sites,每个命令就是一个独立的 JS 文件,社区驱动维护。


十一、使用场景

场景命令示例
调研任务搜 Twitter 话题讨论、arXiv 论文检索
竞品分析GitHub issues 趋势、Product Hunt 新产品
股票查询雪球热榜、东方财富行情
职位搜索BOSS直聘搜索、LinkedIn 查询
内容创作小红书热榜、知乎热榜
技术问题Stack Overflow 答案、V2EX 帖子

十二、注意事项

使用前提

条件说明
Chrome 运行依赖你的 Chrome 保持运行
Daemon 常驻需要后台进程
网络稳定如果浏览器关了或者网络切了,就断了

安全考虑

本质上是在你的浏览器里执行代码,如果接入的是第三方 Agent,需要自己评估一下信任边界。

建议:

  • 只接入信任的 Agent
  • 定期检查浏览器扩展权限
  • 不在公共机器上使用

十三、总结

核心价值

价值说明
零 API Key不需要任何密钥
零爬虫不需要逆向 HTTP
零模拟不需要模拟登录
真实登录态用你自己的浏览器
无法被检测它就是用户本人

适用人群

人群适用度
Claude Code / Cursor 用户⭐⭐⭐⭐⭐ 完美
需要联网调研的 Agent⭐⭐⭐⭐⭐ 完美
爬虫开发者⭐⭐⭐⭐ 很好
数据分析师⭐⭐⭐⭐ 很好

核心洞察

AI Agent 落地最大的卡点之一,就是「信息获取」——Agent 能写代码、能跑命令,但它看不到互联网上正在发生的事情,或者看到的太滞后、太残缺。

没有 bb-browser 的时候,AI Agent 的世界基本上是:文件 + 终端 + 少数有 API key 的服务

有了 bb-browser,多了整个互联网。


本文首发于「程序员茄子」博客,原文链接:https://chenxutan.com

推荐文章

阿里云免sdk发送短信代码
2025-01-01 12:22:14 +0800 CST
如何使用go-redis库与Redis数据库
2024-11-17 04:52:02 +0800 CST
全栈工程师的技术栈
2024-11-19 10:13:20 +0800 CST
内网穿透技术详解与工具对比
2025-04-01 22:12:02 +0800 CST
在 Rust 生产项目中存储数据
2024-11-19 02:35:11 +0800 CST
MyLib5,一个Python中非常有用的库
2024-11-18 12:50:13 +0800 CST
底部导航栏
2024-11-19 01:12:32 +0800 CST
mysql删除重复数据
2024-11-19 03:19:52 +0800 CST
Go 如何做好缓存
2024-11-18 13:33:37 +0800 CST
Nginx 性能优化有这篇就够了!
2024-11-19 01:57:41 +0800 CST
html夫妻约定
2024-11-19 01:24:21 +0800 CST
程序员茄子在线接单