Cloudflare Agents Week 2026 深度实战:5 个维度、20 项发布,一张 Cloud 2.0 的完整地图——从 Agent 计算环境到 Agentic Web 的架构级拆解与生产级部署指南(2026)
一周,五个方向,20 项发布。这不是一次功能更新,而是 Cloudflare 对"AI Agent 时代的基础设施应该长什么样"给出的系统性回答。
一、为什么是 Agent?为什么是现在?
过去一年,AI Agent 的工作方式发生了根本性变化。从 ChatGPT 的对话式交互,到 Cursor、Windsurf、DeerFlow 等 Agent 平台的出现,开发者和企业开始真正把 AI Agent 当作生产力工具而非噱头。编程 Agent 帮助开发者以前所未有的速度交付代码,月均完成超 13 万次代码审查,中位耗时仅 3 分 39 秒;支持 Agent 端到端处理工单;研究 Agent 在几分钟内跨数百个来源验证假设。
关键的数据点:人们不只是在运行一个 Agent,而是在同时并行运行多个,全天候不间断。如果全球知识工作者中哪怕只有一小部分,每人并行运行几个 Agent,你就需要数千万个同时运行的会话的计算容量。
传统云计算建立在"一个应用服务多个用户"的模型上——这恰恰是它对 Agent 工作负载无能为力的原因。Agent 的工作模式完全不同:每个用户同时运行多个 Agent,每个 Agent 都有自己的状态、工具链和执行上下文。
这是 Cloudflare 把 2026 年 4 月的发布周命名为 Agents Week 的原因——不是在现有产品上贴 AI 标签,而是针对一个根本不同的计算范式,重新设计基础设施的每一层。
Cloudflare 将其定位为 Cloud 2.0——以 Agent 为主要工作负载而设计的基础设施。
二、五个维度,一张地图
整周的发布围绕五个维度展开:
| 维度 | 核心问题 | 发布数量 |
|---|---|---|
| 计算(Compute) | Agent 在哪里运行? | 5 项 |
| 安全(Security) | Agent 如何安全运行? | 4 项 |
| Agent 工具箱 | Agent 用什么工具完成工作? | 9 项 |
| 原型到生产 | 如何从实验跑到生产? | 5 项 |
| Agentic Web | 互联网如何为 Agent 做好准备? | 4 项 |
下面逐层拆解。
三、计算层:Agent 需要从操作系统到轻量隔离的全谱环境
3.1 核心问题:不是所有 Agent 都需要同样的运行环境
这是理解整个计算层设计的关键洞察。Agent 的计算需求分布在一个巨大的频谱上:
- 重 Agent:需要完整的操作系统来安装包、运行终端命令、编译代码(如代码审查 Agent、DevOps Agent)
- 轻 Agent:需要在毫秒内启动、扩展到数百万并发的轻量级环境(如路由 Agent、分类 Agent、简单工具调用 Agent)
Cloudflare 选择了全谱覆盖的策略,而不是只做某一端。
3.2 Artifacts:给 Agent 一个 Git 兼容的代码仓库
问题:Agent 写了代码,放在哪里?
传统方案是把代码写到一个临时文件系统或虚拟机里,但这带来一系列问题:版本控制怎么办?多 Agent 协作怎么办?如何与人类开发者的 Git 工作流集成?
Artifacts 的解决方案:
Artifacts 是专为 Agent 构建的 Git 兼容版本化存储。它的核心能力:
- 海量仓库支持:可创建数千万个仓库——这对 Agent 场景至关重要,因为每个 Agent 实例可能需要自己的代码仓库
- Git 兼容:可以从任何远程仓库 fork,并将 URL 交给任意 Git 客户端直接使用
- Agent 原生:不是把 Git 照搬过来,而是针对 Agent 的使用模式做了优化(批量创建、快速 fork、元数据管理)
// 概念示例:Agent 使用 Artifacts 管理生成的代码
const artifact = await cloudflare.artifacts.create({
name: `agent-code-${taskId}`,
description: `Code generated for task ${taskId}`,
visibility: 'private'
});
// Agent 将生成的代码推送到 Artifacts
await artifact.push({
files: generatedFiles,
message: 'Agent: implement user authentication module'
});
// 其他 Agent 或人类开发者可以直接 clone
// git clone https://artifacts.cloudflare.com/agent-code-1234
为什么重要:在没有 Artifacts 之前,Agent 生成代码后的"落地"是个老大难问题。要么写临时文件(不可追溯),要么推送到 GitHub(权限和隔离问题),要么存在数据库里(无法用标准工具链操作)。Artifacts 给了 Agent 一个既标准又可扩展的代码归宿。
3.3 Sandboxes 正式 GA:Agent 拥有了真正的计算机
问题:Worker 的隔离环境太轻量,不适合需要安装软件包和运行复杂命令的 Agent。
Sandboxes 的解决方案:
Cloudflare Sandboxes 正式 GA,给 AI Agent 提供一个持久的隔离环境——一台真正的计算机:
- 完整的 Shell:可以执行任意终端命令
- 文件系统:有持久化的磁盘空间
- 后台进程:可以运行长时间的后台任务
- 按需启动:不需要时零成本
- 断点续行:能从上次停下来的地方继续
与其他方案的对比:
| 特性 | Cloudflare Workers | Cloudflare Sandboxes | AWS Lambda | GCP Cloud Run |
|---|---|---|---|---|
| 启动时间 | ~5ms | ~100ms | ~500ms | ~1s |
| 文件系统 | 无 | 完整 | 只读层 + 临时 | 只读层 + 临时 |
| Shell 访问 | 无 | 完整 | 无 | 无 |
| 后台进程 | 无 | 支持 | 无 | 支持 |
| 持久化 | 通过 KV/DO | 文件系统 | 通过 S3 | 通过 GCS |
| 适合 Agent 类型 | 轻量工具调用 | 重度代码执行 | 函数式 | 服务式 |
// 概念示例:代码审查 Agent 在 Sandbox 中执行
import { Sandbox } from '@cloudflare/sandbox';
export default {
async fetch(request: Request, env: Env) {
const sandbox = await Sandbox.create({
image: 'ubuntu-22.04',
memory: '512MB',
timeout: 300 // 5 分钟超时
});
// 安装代码审查工具
await sandbox.exec('apt-get update && apt-get install -y nodejs npm');
// Clone 代码仓库
await sandbox.exec(`git clone ${repoUrl} /workspace`);
// 运行静态分析、测试和安全扫描
const lintResult = await sandbox.exec('cd /workspace && npm run lint --json');
const testResult = await sandbox.exec('cd /workspace && npm test -- --reporter=json');
await sandbox.exec('cd /workspace && npx audit-ci --moderate');
const report = generateReviewReport(lintResult, testResult);
return Response.json(report);
}
};
3.4 Sandbox 出口控制:零信任的对外访问
问题:Agent 在 Sandbox 中执行代码时,需要访问外部网络,但凭证泄露是巨大的安全风险。
Sandbox 的出口控制为 Agent 提供可编程的零信任出口代理:
- 凭证注入:动态注入凭证,Agent 代码本身无法读取原始 Token
- 安全策略:可编程的网络出口策略(允许/拒绝特定域名、限制请求频率等)
- 审计日志:所有外部请求都有完整的审计记录
┌─────────────────────────────┐
│ AI Agent (Sandbox) │
│ - 执行代码 │
│ - 不知道原始凭证 │
│ - 所有外部请求经过出口代理 │
└──────────┬──────────────────┘
│
▼
┌─────────────────────────────┐
│ Egress Proxy (Outbound │
│ Workers) │
│ - 凭证注入 / 策略执行 / 审计│
└──────────┬──────────────────┘
│
▼
┌─────────────────────────────┐
│ 外部 API / 互联网 │
└─────────────────────────────┘
// 概念示例:配置 Sandbox 出口策略
const sandbox = await Sandbox.create({
egress: {
rules: [
{
host: 'registry.npmjs.org',
injectCredentials: { token: env.NPM_TOKEN },
rateLimit: { requestsPerMinute: 100 }
},
{
host: 'api.github.com',
injectCredentials: { oauth: env.GITHUB_TOKEN },
rateLimit: { requestsPerMinute: 30 }
},
{ action: 'deny' } // 拒绝所有其他外部访问
]
}
});
3.5 Dynamic Workers + Durable Objects:每个 AI 生成的应用有自己的数据库
问题:Agent 生成的不只是代码片段,还有完整的应用,需要持久状态。
Durable Object Facets 允许 Dynamic Workers 实例化拥有各自独立 SQLite 数据库的 Durable Object。每个由 Agent 动态生成的应用都有自己独立的数据库,无需预先创建数据库资源。
export class UserApp extends DurableObject {
private db: DurableObjectStorage;
constructor(ctx: DurableObjectConstructor) {
super(ctx);
this.db = ctx.storage;
}
async addCustomer(data: CustomerData) {
const id = this.ctx.newUniqueId();
await this.db.put(`customer:${id}`, data);
return id;
}
}
export default {
async fetch(request: Request, env: Env) {
const userId = getUserId(request);
const id = env.USER_APP.idFromName(userId);
const app = env.USER_APP.get(id);
return app.fetch(request);
}
};
3.6 Workflows v2:并发上限提升 50 倍
Workflows v2 重新设计了控制面,将并发从 1,000 提升到 50,000,创建速率限制提升到 300/秒,支撑持久后台 Agent 的规模化场景。
import { WorkflowEntrypoint, WorkflowStep, WorkflowEvent } from 'cloudflare:workers';
class AgentWorkflow extends WorkflowEntrypoint<Env, Params> {
async run(event: WorkflowEvent<Params>, step: WorkflowStep) {
const analysis = await step.do('analyze', async () => {
return await analyzeRequest(event.payload);
});
const code = await step.do('generate', async () => {
return await generateCode(analysis);
});
const testResult = await step.do('test', async () => {
return await runInSandbox(code);
});
await step.do('deploy', async () => {
return await deployToProduction(testResult);
});
return { success: true, analysis, testResult };
}
}
四、安全层:Agent 的安全不能是事后补丁
4.1 核心洞察
Agent 连接私有网络、访问内部服务,并以用户名义采取自主行动。当组织里的任何人都可以启动自己的 Agent 时,安全必须是默认状态,而不是事后加上去的东西。
传统安全模型的三个问题:
- 身份绑定人类:Agent 不是人类,但需要访问相同的资源
- 权限粗粒度:人使用的服务账户权限通常过大
- 凭证静态管理:API Key 一旦泄露,风险无限放大
4.2 Cloudflare Mesh:统一私有网络
通过与 Workers VPC 集成,为用户、节点和 Agent 提供统一的私有网络——Agent 自动获得对私有资源的网络访问,无需手动配置隧道。人类用户、Agent、Workers 共享同一套网络策略。
┌──────────────────────────────────────────────────┐
│ Cloudflare Mesh │
│ ┌─────────┐ ┌─────────┐ ┌──────────────────┐ │
│ │ 用户 VPN │ │ Workers │ │ AI Agents │ │
│ └────┬─────┘ └────┬─────┘ └────────┬─────────┘ │
│ └─────────────┼─────────────────┘ │
│ ┌──────▼──────┐ │
│ │ Workers VPC │ │
│ └──────┬──────┘ │
│ ┌─────────────┼─────────────┐ │
│ ▼ ▼ ▼ │
│ ┌─────────┐ ┌─────────┐ ┌──────────┐ │
│ │ PostgreSQL│ │ Redis │ │ 内部 API │ │
│ └─────────┘ └─────────┘ └──────────┘ │
└──────────────────────────────────────────────────┘
4.3 Managed OAuth for Access:Agent 的身份认证
采用 RFC 9728 标准,Agent 可以代表用户完成认证,而不必使用不安全的服务账户。内部应用配置一次即对所有 Agent 可用,Agent 以用户身份而非服务账户身份访问资源。
4.4 非人类身份安全三件套
| 工具 | 解决的问题 | 关键能力 |
|---|---|---|
| 可扫描的 API Token | Token 泄露到代码仓库时自动检测 | 扫描 GitHub 等平台,检测硬编码的 Token |
| 增强的 OAuth 可见性 | 不清楚哪些 Agent 在使用哪些 OAuth 授权 | 统一的授权审计面板 |
| 资源范围权限 GA | 服务账户权限过大 | 细粒度的资源级别权限控制 |
4.5 企业级 MCP 参考架构与 Code Mode
Cloudflare 分享了内部使用 Access、AI Gateway 和 MCP Server Portal 治理 MCP 的完整方案。
Code Mode 尤其值得注意——它通过将工具发现从 Schema 预加载改为运行时代码调用,大幅削减 Token 成本。传统 MCP 模式下,Agent 需要先加载所有可用工具的 Schema,这在工具数量多时会造成巨大的 Token 消耗。Code Mode 让 Agent 在运行时按需发现和调用工具。
const agent = new Agent({
inferenceProvider: 'cloudflare-ai',
tools: {
// Code Mode: 只定义工具发现入口,不预加载所有 Schema
discover: async (context: string) => {
return await mcpServer.discoverTools(context);
},
call: async (toolName: string, params: any) => {
return await mcpServer.callTool(toolName, params);
}
}
});
五、Agent 工具箱:让 Agent 能思考、记忆、沟通和感知
5.1 五种核心能力
- 思考(推理):正确的大模型调用和推理能力
- 记忆(持久化):记住重要的事,忘掉不重要的事
- 沟通(多渠道):语音、文字、邮件
- 感知(搜索 + 浏览器):获取外部信息
- 行动(执行环境):运行代码、调用 API
5.2 Project Think:下一代 Agents SDK 预览
最值得关注的一个发布。Agents SDK 从轻量级原语进化为自带电池的完整 Agent 平台——能思考、能行动、能持久化。
import { Agent, Memory, Tools } from '@cloudflare/agents-sdk';
const agent = new Agent({
name: 'code-reviewer',
model: 'cloudflare@meta-llama/llama-3.1-70b-instruct',
reasoning: {
chainOfThought: true,
planning: true,
selfReflection: true
},
tools: [
Tools.gitClone, Tools.fileRead, Tools.fileWrite,
Tools.shellExec, Tools.webSearch, Tools.codeAnalysis
],
memory: new Memory({
backend: 'cloudflare-agent-memory',
retention: '30d',
importanceThreshold: 0.7
})
});
const review = await agent.run(
'Review the authentication module for security issues'
);
5.3 语音 Agent:30 行代码接入实时语音
import { VoiceAgent, WebSocketHandler } from '@cloudflare/agents-sdk';
export default {
async websocket(ws: WebSocket, env: Env) {
const voiceAgent = new VoiceAgent({
model: 'cloudflare@meta-llama/llama-3.1-70b-instruct',
stt: { provider: 'cloudflare', language: 'zh-CN' },
tts: { provider: 'cloudflare', voice: 'zh-CN-XiaoxiaoNeural' },
systemPrompt: '你是一个技术助手,帮助用户解答编程问题。'
});
WebSocketHandler.handle(ws, voiceAgent);
}
};
5.4 Email Service 公开 Beta:让 Agent 进入收件箱
支持从 Agent 原生发送、接收和处理邮件。典型场景:工单处理 Agent 自动回复邮件工单,报告生成 Agent 定期发送报告,客户支持 Agent 处理咨询邮件并调用内部 API。
5.5 统一推理层:14+ 提供商,一个调用接口
import { Ai } from '@cloudflare/ai';
export default {
async fetch(request: Request, env: Env) {
const ai = new Ai(env.AI);
// 同一个 API,不同模型,切换只需改参数
const codingTask = ai.run('@anthropic/claude-3.5-sonnet', {
prompt: 'Write a Python REST API using FastAPI',
temperature: 0.2
});
const reasoningTask = ai.run('@meta-llama/llama-3.1-70b-instruct', {
prompt: 'Analyze microservices architecture',
temperature: 0.5
});
return Response.json({ code: await codingTask, analysis: await reasoningTask });
}
};
5.6 Unweight:无损压缩 LLM 22%
专为推理时设计的无损压缩系统,不牺牲精度,最高 22% 体积缩减。在边缘推理中 GPU 内存带宽是瓶颈,22% 缩减在全球 300+ 边缘节点上产生巨大规模效应。
5.7 Agent Memory:托管的持久记忆服务
import { AgentMemory } from '@cloudflare/agent-memory';
const memory = new AgentMemory({
namespace: 'code-reviewer',
maxEntries: 10000,
retentionPolicy: { importanceThreshold: 0.5, maxAge: '30d' }
});
// Agent 学到的经验自动保存
await memory.store({
content: '项目 X 的认证模块存在 JWT 过期时间过短的问题',
importance: 0.9,
tags: ['security', 'jwt', 'project-x']
});
// 后续审查时自动召回相关经验
const memories = await memory.search({
query: 'reviewing authentication code for project X',
topK: 5
});
5.8 AI Search:Agent 的搜索原语
专为 Agent 设计的搜索能力:动态创建搜索实例、上传文件、混合检索(向量 + 关键词)、相关性增强。
5.9 Browser Run:给 Agent 一个浏览器
Browser Rendering 更名为 Browser Run,新增 Live View、Human in the Loop、CDP 访问、会话录制、4 倍并发提升。适用于网页抓取、UI 自动化测试、竞品分析等 Agent 场景。
六、原型到生产:从实验跑到生产
6.1 cf CLI:统一命令行工具
新 CLI cf 覆盖 Cloudflare 近 3,000 个 API 操作,AI Agent 可以通过它管理所有 Cloudflare 资源——从 Worker 部署到域名注册,全流程无需离开终端。
cf workers deploy ./my-agent-function
cf kv put --namespace=my-app-config key=value
cf databases create my-app-db --plan=free
cf domains register my-agent-app.com
6.2 Agent Lee:Dashboard 内置 Agent
控制台内置的 Agent,用自然语言管理基础设施——不是解释文档,而是真正执行操作。代表基础设施管理的未来方向。
6.3 Flagship:亚毫秒级功能开关
基于 KV 和 Durable Objects 的原生功能开关服务,消除第三方延迟。Agent 应用需要灰度发布、A/B 测试、快速回滚,Flagship 利用边缘网络提供亚毫秒级评估。
import { Flagship } from '@cloudflare/flagship';
export default {
async fetch(request: Request, env: Env) {
const flags = new Flagship(env);
const enableNewModel = await flags.evaluate('use-new-agent-model', {
userId: getUserId(request),
region: request.cf?.colo
});
const model = enableNewModel ? 'claude-3.5-sonnet' : 'llama-3.1-70b';
const result = await ai.run(model, { prompt: getPrompt(request) });
return Response.json(result);
}
};
6.4 PlanetScale + Workers:数据库集成
Agent 应用可以使用 Postgres 和 MySQL,通过 PlanetScale 与 Workers 无缝连接。
6.5 Registrar API Beta:代码里注册域名
Agent 可以在代码中完成域名搜索、可用性查询和注册,实现从开发到上线的全自动化流程。
七、Agentic Web:让互联网为 Agent 做好准备
7.1 Agent Readiness Score
帮网站所有者了解其对 AI Agent 的支持程度,探索新兴标准。Cloudflare 同时展示了如何将自身开发者文档改造成对 Agent 最友好的文档。
7.2 Redirects for AI Training:把"建议"变成强制执行
这是一个非常实际的问题。网站通过 robots.txt 和 AI-Disallowed HTTP 头向爬虫发出"请不要抓取这些内容"的建议,但建议不是命令——不负责任的爬虫完全可以选择忽略。
Cloudflare 的方案:任何 Cloudflare 用户只需一个开关、无需修改源站,即可将经过验证的爬虫重定向到 canonical 页面。这把软性"建议"变成了强制执行。
技术实现思路:
Agent 请求 → Cloudflare Edge
→ 检查 User-Agent / IP 信誉数据库
→ 匹配已知 AI 爬虫(Googlebot, GPTBot, ClaudeBot 等)
→ 如果目标 URL 是废弃/过时内容
→ 302 重定向到 canonical URL
→ 否则正常响应
这个功能的价值在于:它让网站所有者在不修改源站代码的情况下,控制 AI 训练数据的质量。对于维护了大量历史内容(有些已经过时或错误)的网站来说,这是一个实用的工具。
7.3 共享字典压缩:跟上 Agentic Web 的节奏
Agent 频繁请求网页内容时,传输效率成为关键。Cloudflare 的共享压缩字典利用浏览器缓存的旧版本资源作为新版本的压缩字典,只需传输差异部分。
测试数据令人印象深刻:272KB → 2.6KB,节省 99% 的传输体积。
技术原理:
传统的压缩(gzip/brotli)是基于单个文件的通用压缩。共享字典压缩的核心思想是:新版本的网页与旧版本通常高度相似(只是更新了部分内容),因此旧版本的内容本身就是新版本的"字典"。
传统压缩:
新版本页面(272KB) → gzip → 60KB(压缩率 78%)
共享字典压缩:
旧版本页面(270KB) → 作为字典
新版本页面(272KB) - 旧版本 = 差异(2KB) → 2.6KB
客户端:字典 + 差异 = 重建完整新版本
这对 Agentic Web 场景尤其有价值——Agent 可能会反复请求同一网页来检查内容更新,共享字典压缩让增量传输几乎免费。Beta 已开放。
7.4 网络性能更新:全球 60% 最快
通过将请求处理层迁移到基于 Rust 的 FL2 架构,Cloudflare 将在全球顶级网络中排名第一的覆盖率从 40% 提升到 60%。FL2 是一个完全用 Rust 重写的请求处理层,替代了原有的 Nginx-based 架构,在性能、内存安全和可扩展性方面都有显著提升。
八、架构视角:Cloud 2.0 的完整图景
Agents Week 2026 发布的 20 项内容,单独看每一项都有其技术价值,但合在一起读,它们描绘的是一个系统性的架构愿景:
8.1 五层架构
┌──────────────────────────────────────────────────────┐
│ Agentic Web(最上层) │
│ Agent Readiness Score / Redirects / 共享压缩 │
├──────────────────────────────────────────────────────┤
│ 原型到生产(开发者层) │
│ cf CLI / Agent Lee / Flagship / Registrar API │
├──────────────────────────────────────────────────────┤
│ Agent 工具箱(能力层) │
│ Think / Memory / Search / Voice / Email / Browser │
│ 统一推理层 / Unweight 压缩 │
├──────────────────────────────────────────────────────┤
│ 安全(治理层) │
│ Mesh / Managed OAuth / Token扫描 / MCP 架构 / Code Mode│
├──────────────────────────────────────────────────────┤
│ 计算(基础层) │
│ Workers / Sandboxes / Artifacts / DO Facets / Workflows│
└──────────────────────────────────────────────────────┘
8.2 关键设计哲学
1. 全谱计算,按需选择
Cloudflare 没有试图用一个"万能"运行环境解决所有问题,而是提供了从 Worker(毫秒级启动)到 Sandbox(完整 OS)的全谱选择。这对 Agent 场景至关重要,因为不同类型的 Agent 对计算环境的需求差异巨大。
2. 安全是默认状态,不是事后补丁
从身份认证(Managed OAuth)到网络隔离(Mesh),从凭证管理(可扫描 Token)到工具治理(MCP Code Mode),安全被嵌入到每一层,而不是作为一个单独的"安全模块"。
3. 统一推理,多模型自由切换
14+ 提供商的统一 API,加上自研的 Unweight 压缩和高性能推理栈,让 Agent 应用可以自由选择最适合的模型,而不被锁定在单一提供商。
4. 工具即原语,Agent 自主组装
Agent Memory、AI Search、Browser Run、Email Service——这些不是"功能",而是 Agent 可以自主调用的原语。Project Think 平台把这些原语组装成一个有思考能力的 Agent。
5. Agentic Web 是长远愿景
Agent Readiness Score、Redirects for AI Training、共享字典压缩——这些功能指向一个更长远的问题:整个互联网的内容层,如何从为人类索引转变为为机器可读。这不是今天的问题,但 Cloudflare 已经开始布局。
8.3 与竞品的对比
| 能力 | Cloudflare (Agents Week) | AWS (Bedrock Agents) | GCP (Vertex AI Agents) | Vercel (V0 SDK) |
|---|---|---|---|---|
| 边缘计算 + Agent | Workers + Sandboxes | Lambda + Fargate | Cloud Run + GKE | Edge Runtime |
| Agent 安全 | Mesh + OAuth + MCP | IAM + VPC | IAM + VPC SC | 无 |
| Agent 工具箱 | 9 项原语 | Bedrock Tools | Vertex Extensions | 有限 |
| Agent 记忆 | Agent Memory | 无内置 | 无内置 | 无 |
| 统一推理 | 14+ 提供商 | 3 家 | 3 家 | OpenAI 为主 |
| 沙箱代码执行 | Sandboxes GA | 无内置 | 无内置 | 无 |
| Agentic Web | 4 项发布 | 无 | 无 | 无 |
| 功能开关 | Flagship | Feature Flags | 无 | 无 |
| 域名注册 | Registrar API | Route53 | Cloud Domains | 无 |
核心差异:Cloudflare 是唯一一个从计算、安全、工具、开发体验到 Web 层面做了全栈覆盖的平台。其他厂商要么聚焦在模型层(AWS Bedrock、GCP Vertex),要么聚焦在开发体验(Vercel),没有谁像 Cloudflare 这样重新设计了基础设施的每一层。
九、生产级部署指南:如何开始
9.1 快速上手:5 分钟构建你的第一个 Cloudflare Agent
# 1. 安装 cf CLI
npm install -g @cloudflare/cf
# 2. 创建 Agent 项目
cf create my-agent-app
# 3. 选择模板
# - agent-code-reviewer: 代码审查 Agent
# - agent-customer-support: 客户支持 Agent
# - agent-research: 研究 Agent
# 4. 部署
cf deploy
9.2 架构选型指南
根据你的 Agent 类型选择合适的运行环境:
| Agent 类型 | 推荐环境 | 原因 |
|---|---|---|
| API 路由 Agent | Workers | 毫秒启动,百万并发 |
| 代码生成/执行 Agent | Sandboxes | 完整 OS,可安装依赖 |
| 数据分析 Agent | Workers + DO | 独立 SQLite,持久状态 |
| 长任务编排 Agent | Workflows v2 | 5 万并发,持久执行 |
| 多模型推理 Agent | 统一推理层 | 14+ 提供商,一键切换 |
| 需要浏览器的 Agent | Browser Run | 完整浏览器,Live View |
| 需要记忆的 Agent | Agent Memory | 持久化,自动清理 |
9.3 成本考量
Cloudflare Workers 免费层每天 100,000 次请求,对于原型开发和低流量 Agent 来说完全免费。Sandbox、Memory、Search 等付费功能的定价也在不断优化。
关键优势:Cloudflare 的按请求计费模式天然适合 Agent 场景——Agent 的工作负载本身就是事件驱动的、间歇性的,不需要为空闲时间付费。
9.4 安全最佳实践
在 Cloudflare 上构建生产级 Agent 应用时,推荐以下安全实践:
1. 最小权限原则
为每个 Agent 分配最小必要的权限。不要使用全局 API Token,而是使用资源范围权限(Resource-scoped Permissions):
// 为代码审查 Agent 创建专用 Token
const agentToken = await cloudflare.tokens.create({
name: 'code-reviewer-agent',
permissions: [
{ resource: 'artifacts', action: 'read' },
{ resource: 'sandboxes', action: 'create' },
{ resource: 'kv', namespace: 'review-config', action: 'read' }
],
expiresAt: '2026-12-31T23:59:59Z',
scannable: true // 启用泄露扫描
});
2. Egress 策略白名单
Sandbox 出口策略应该采用白名单模式,而不是黑名单模式:
// 推荐:白名单模式
const egressPolicy = {
defaultAction: 'deny',
allowRules: [
{ host: 'registry.npmjs.org', rateLimit: { rpm: 100 } },
{ host: 'api.github.com', rateLimit: { rpm: 30 } },
{ host: 'api.openai.com', rateLimit: { rpm: 10 } }
]
};
// 不推荐:黑名单模式
// const egressPolicy = { defaultAction: 'allow', denyRules: [...] };
3. 审计日志
启用所有 Agent 操作的审计日志,建立异常行为检测机制:
// 启用 Agent 审计日志
const audit = new AgentAudit(env.AUDIT);
audit.record({
agentId: 'code-reviewer',
action: 'sandbox.exec',
target: 'npm install',
sandboxId: sandbox.id,
timestamp: Date.now(),
egressRequests: sandbox.egressLog
});
9.5 多 Agent 编排模式
在实际生产中,多个 Agent 需要协同工作。以下是几种常见的编排模式:
模式 1:串行管道
Agent A 的输出作为 Agent B 的输入,适用于代码审查 → 测试 → 部署的流水线:
// 串行管道编排
const pipeline = new WorkflowPipeline(env);
pipeline
.addStep('code-review', reviewAgent)
.addStep('security-scan', securityAgent)
.addStep('run-tests', testAgent)
.addStep('deploy', deployAgent);
const result = await pipeline.execute({
repoUrl: 'https://github.com/example/project',
branch: 'main'
});
模式 2:并行扇出-扇入
多个 Agent 同时分析同一问题,结果汇总后决策:
// 并行分析 + 汇总决策
const parallelResults = await Promise.all([
securityAgent.analyze(code),
performanceAgent.analyze(code),
styleAgent.analyze(code)
]);
const finalDecision = await decisionAgent.synthesize(parallelResults);
模式 3:人机协作(Human-in-the-Loop)
关键决策点需要人类审批,Agent 负责 preparatory work:
// Human-in-the-Loop 模式
const analysis = await analysisAgent.run(code);
// 如果发现高风险问题,请求人类介入
if (analysis.riskLevel > 0.8) {
const humanDecision = await humanApproval.request({
analysis: analysis.summary,
riskDetails: analysis.details,
options: ['approve', 'reject', 'request-changes']
});
if (humanDecision === 'reject') return { action: 'stopped', reason: 'human-rejected' };
}
await deployAgent.deploy(analysis.approvedChanges);
9.6 监控与可观测性
Agent 应用的可观测性与传统应用有很大不同。你需要监控的不仅是延迟和错误率,还包括:
- Agent 决策质量:Agent 的输出是否符合预期
- 工具调用成本:API 调用次数和 Token 消耗
- 记忆命中率:持久记忆的有效性
- 人机协作频率:多少比例的请求需要人类介入
// Agent 可观测性指标
const metrics = new AgentMetrics(env.METRICS);
// 记录关键指标
metrics.record('agent.decision.confidence', {
agent: 'code-reviewer',
confidence: analysis.confidence,
reasoningSteps: analysis.steps.length
});
metrics.record('agent.tools.cost', {
agent: 'code-reviewer',
totalTokens: analysis.totalTokens,
apiCalls: analysis.apiCallCount,
estimatedCost: analysis.estimatedCost
});
metrics.record('agent.memory.hit_rate', {
agent: 'code-reviewer',
queries: memory.queries,
hits: memory.hits,
hitRate: memory.hits / memory.queries
});
十、总结:Cloud 2.0 的意义
Agents Week 2026 结束了,但 Agentic Cloud 才刚刚开始。
这周发布的一切——从计算和安全到 Agent 工具箱和 Agentic Web——只是基础。对于正在构建 AI Agent 应用的开发者而言,这张地图值得仔细对照自己的技术选型。
很多问题——持久状态、工具连接、身份安全、内存管理——Cloudflare 已经给出了自己的答案,并且是在自己内部 6,100 人、超过 13 万次代码审查的真实生产负载上验证过的答案。
三个关键判断:
Agent 基础设施的竞争已经从"谁的模型更强"转向"谁的基础设施更完整"。Cloudflare 的五层架构表明,Agent 平台不是一个大模型 API,而是一整套从计算到安全到 Web 的完整栈。
边缘计算 + Agent 是一个被低估的组合。大多数 Agent 平台聚焦在集中式 GPU 集群上,但 Agent 的大量工作负载(路由、分类、工具调用)更适合边缘部署。Cloudflare 的全球 300+ 边缘节点在这个维度上有独特优势。
Agentic Web 是下一个十年的基础设施问题。今天的 Agent 还在浏览为人类建造的互联网。谁率先解决 Web 内容的机器可读性问题,谁就在下一个时代占据制高点。
Cloudflare Agents Week 2026 不只是一次产品发布,它是对 Cloud 2.0 的宣言。当 Agent 成为计算的主要工作负载时,基础设施需要被重新思考——Cloudflare 已经给出了他们的答案。
参考资源: