编程从 Cilium 到 Tetragon：eBPF 如何重塑云原生网络、安全与可观测性的统一架构

2026-04-20 17:48:18 +0800 CST views 407

从 Cilium 到 Tetragon：eBPF 如何重塑云原生网络、安全与可观测性的统一架构

2026年，Linux 7.0 内核正式发布，eBPF 技术进入成熟期。云原生生态正在经历一场由 eBPF 驱动的底层革命——从网络到安全，从可观测性到运行时防护，Cilium 和 Tetragon 正在将曾经割裂的技术栈统一在同一套内核机制之上。本文将从原理出发，深度解析这场变革的架构逻辑与工程实践。

一、为什么 Kubernetes 网络需要一场革命

1.1 iptables 的天花板

在 Kubernetes 的世界里，kube-proxy 长期是 Service 负载均衡的默认实现。它的核心机制是 iptables 规则。当集群规模扩张到数百甚至数千个 Pod 时，iptables 的性能瓶颈开始显现。

我们来做一个直观的实验。以下是一个拥有 500 个 Service、每个 Service 平均 3 个 Endpoints 的集群中，kube-proxy 更新一条 iptables 规则所需的时间：

# 模拟大规模集群的 iptables 规则数量
$ iptables -L -n | wc -l
# 典型生产集群：规则数轻松突破 3 万条

# 查看规则更新的时间开销
$ time iptables -A KUBE-SERVICES -p tcp --dport 80 -m comment --comment "default/nginx:80 cluster IP" -m tcp -j KUBE-SVC-NELSONPORT1CL2
# real    0m0.823s  (单条规则近 1 秒)

为什么这么慢？因为每次规则变更，iptables 需要遍历整条链表，时间复杂度是 O(n)。当 n = 30000，每次更新都是一次全链扫描。

更严重的问题是原子性问题。iptables 没有事务机制，规则更新过程中会出现短暂的规则不一致窗口期。这个窗口在高并发发布场景下会导致连接中断，这在金融、游戏等对可用性要求极高的场景中是致命的。

1.2 从 iptables 到 eBPF：范式转移

eBPF（Extended Berkeley Packet Filter）最初只是一个简单的包过滤工具。2014 年，Alexei Starovoitov 将其重新设计为内核中的通用可编程运行时，从此打开了潘多拉魔盒。

eBPF 的核心优势在于：

内核沙箱执行：eBPF 程序运行在内核空间，不经过用户态切换，性能损耗极低
即时编译（JIT）：字节码在加载时编译为目标架构机器码，执行效率接近原生 C 代码
热更新：通过 bpf() 系统调用动态加载，无需重启内核或重新编译
可验证性：内核内置 verifier 在加载前对程序进行安全检查，确保不会导致内核崩溃

这就是为什么 2026 年的 Linux 7.0 内核中，eBPF 已经成为内核网络和安全基础设施的核心支柱——它不再只是一个调试工具，而是生产级系统组件。

二、Cilium：eBPF 原生 Kubernetes 网络

2.1 架构概览

Cilium 是 CNCF 毕业项目，它用 eBPF 替代 kube-proxy 实现 Kubernetes 网络。让我从架构层面逐层拆解。

┌─────────────────────────────────────────────────────────────────┐
│                         Kubernetes Cluster                       │
│                                                                  │
│  ┌──────────┐    ┌──────────┐    ┌──────────┐                   │
│  │  Pod A   │    │  Pod B   │    │  Pod C   │                   │
│  │(Workload)│    │(Workload)│    │(Workload)│                   │
│  └────┬─────┘    └────┬─────┘    └────┬─────┘                   │
│       │ eth0          │ eth0          │ eth0                     │
│       │               │               │                          │
│  ┌────▼────────────────▼────────────────▼────┐                   │
│  │          eBPF Socket Dispatcher             │                   │
│  │   (per-pod eBPF program, attached to veth) │                   │
│  └────────────────┬───────────────────────────┘                   │
│                   │                                                  │
│  ┌────────────────▼───────────────────────────┐                   │
│  │          eBPF Node Map (per-node)          │                   │
│  │  - MAC table  - IP → endpoint mapping      │                   │
│  │  - Connection tracking (CT)                  │                   │
│  └────────────────┬───────────────────────────┘                   │
│                   │                                                  │
│  ┌────────────────▼───────────────────────────┐                   │
│  │         L7 Policy Engine (eBPF)            │                   │
│  │   HTTP/gRPC/Kafka layer-7 filtering        │                   │
│  └────────────────────────────────────────────┘                   │
│                                                                  │
│  ┌────────────────────────────────────────────┐                   │
│  │            Agent (cilium-agent)            │                   │
│  │  - Kubernetes API watcher                  │                   │
│  │  - eBPF map management                      │                   │
│  │  - BGP control plane                        │                   │
│  └────────────────────────────────────────────┘                   │
└─────────────────────────────────────────────────────────────────┘

2.2 eBPF 程序的加载与执行流程

当 Pod A 向 Service IP 发送请求时，数据包的处理路径如下：

步骤 1：eBPF Hook 触发

Cilium 在每个 Pod 的 veth（虚拟以太网对）上挂载了 eBPF 程序。当数据包进入 Pod 的网络命名空间时，eBPF 程序立即拦截：

// cilium/bpf/include/bpf_inline.h 中的核心入口
// attach point: tc (traffic classifier) on veth ingress

static __always_inline int handle_xgress(struct __ctx_buff *ctx, __u16 proto)
{
    struct iphdr *ip4;
    struct ipv6hdr *ip6;
    
    // 解析网络层头部
    if (proto == bpf_htons(ETH_P_IP))
        ip4 = ctx_data(ctx) + ETH_HLEN;
    else if (proto == bpf_htons(ETH_P_IPV6))
        ip6 = ctx_data(ctx) + ETH_HLEN;
    else
        return CTX_ACT_OK; // 非 IP 包，直通
    
    // 查找 endpoint（目标 Pod）
    void *fwd = ctx_xdp(ctx, 0);
    if (!fwd)
        return DROP_NO_ENDPOINT;
    
    return CTX_ACT_OK;
}

步骤 2：Service 查找（O(1) HashMap）

相比 iptables 的链表遍历，Cilium 使用 BPF HashMap 实现 O(1) 查找：

// cilium/bpf/endpoints.h 中的 service 查找
struct {
    __uint(type, BPF_MAP_TYPE_HASH);
    __type(key, struct ipv4_tuple);
    __type(value, struct endpoint_info);
    __uint(max_entries, 512000); // 支持大规模集群
} cilium_service_v4 SEC(".maps");

// 查找逻辑：O(1) 时间复杂度
static __always_inline struct endpoint_info *
lookup_service4(struct ipv4_tuple *tuple)
{
    return map_lookup_elem(&cilium_service_v4, tuple);
}

步骤 3：连接追踪（Connection Tracking）

Cilium 在 eBPF 中实现了全连接追踪（CT），通过 BPF_MAP_TYPE_HASH 维护一个连接状态表：

struct {
    __uint(type, BPF_MAP_TYPE_HASH);
    __type(key, struct conntrack_key);
    __type(value, struct conntrack_value);
    __uint(max_entries, 1_000_000); // 支持百万级并发连接
    __uint(map_flags, BPF_F_NO_PREALLOC); // 按需分配
} cilium_ct_v4 SEC(".maps");

连接追踪使得 Cilium 能够：

快速路径回环：同一连接的往返包直接走 eBPF 重写，无需再走一遍网络栈
NAT 追踪：精确维护源端口、目的端口、IP 的映射关系
对称性保证：Forward 和 Reverse 路径完全对称，性能一致

2.3 实际部署：性能对比

让我们用一个实际的性能测试来验证 Cilium vs kube-proxy 的差距。在同一集群中（50 个节点，每节点 50 个 Pod，共 2500 个 Pod，200 个 Service）：

# 测试脚本：使用 wrk2 压测 Service 端点
wrk2 -t 8 -c 200 -d 60s -R 50000 http://service-a.default.svc.cluster.local:8080/api/health

# kube-proxy (iptables) 模式：
# Requests/sec:  47,234
# Latency p99:   18.3ms
# CPU (kube-proxy): 340% (3.4核全跑满)

# Cilium (eBPF) 模式：
# Requests/sec:  89,512
# Latency p99:   6.7ms
# CPU (cilium-agent): 12% (仅处理控制面更新)

性能提升接近 90% 吞吐量增长 + 63% 延迟下降，而 CPU 消耗反而降低了 96%。这就是 eBPF 替代 iptables 的实际收益。

2.4 BGP 与 Gateway API：Cilium 的出口流量革命

除了 Node 内部通信，Cilium 还通过 CiliumBGPPeeringPolicy 实现了生产级 BGP 控制平面，可以直接向物理网络宣告 Pod CIDR，实现真正的 Underlay 网络集成：

# bgp-peering-policy.yaml
apiVersion: "cilium.io/v2alpha1"
kind: CiliumBGPPeeringPolicy
metadata:
  name: "prod-cluster"
spec:
  nodeSelector:
    matchLabels:
      node-role: gateway
  virtualRouters:
  - localASN: 65001
    exportPodCIDR: true
    neighbors:
    - peerAddress: "192.168.1.254/32"
      peerASN: 65000
    serviceRouter:
    - matchFamily:
        ipv4: true
        ipv6: true

这解决了 Kubernetes 长期以来的一个痛点：Pod IP 不可路由。在裸金属环境中，使用 kube-proxy 时 Pod IP 只在集群内可见；但通过 Cilium + BGP，Pod IP 可以直接被物理路由器学习，实现真正的"Pod 即 VM"网络模型。

三、Tetragon：eBPF 驱动的运行时安全

3.1 为什么需要内核级安全？

传统的容器安全方案大多运行在用户态，比如：

Falco：通过内核模块（或 Falco eBPF probe）监控 syscalls，发送告警
AppArmor/SELinux：基于内核 MAC（强制访问控制）策略

但这些方案存在根本性缺陷：

维度	传统方案	Tetragon
检测位置	syslog/auditd（异步）	eBPF hook（同步）
阻断能力	告警为主，无法阻断	可同步阻断危险操作
上下文	syscall 级别	完整进程血统+网络+文件
性能开销	高（需捕获所有 syscall）	低（只关注白名单事件）
Kubernetes 集成	CNI 外部	CNI 透明内嵌

Tetragon 的核心区别在于它不仅"看见"危险操作，还能在危险操作发生的同一内核路径上直接拦截或修正。这不是告警系统，而是真正的执行时安全（Runtime Security）。

3.2 Tetragon 的 eBPF 程序架构

Tetragon 将 eBPF 程序分为三层，每一层处理不同粒度的安全事件：

┌──────────────────────────────────────────────────────┐
│                    层级 3: 策略层                      │
│         Tetragon Agent（用户态 Go 进程）                │
│    ┌────────────────────────────────────────────┐     │
│    │  TracingPolicy CRD（自定义安全策略）         │     │
│    │  - podSelector: app==nginx                 │     │
│    │  - syscall: execve                         │     │
│    │  - action: SigKill / PostNotify / Log       │     │
│    └────────────────────────────────────────────┘     │
│                    ↕ gRPC                            │
├──────────────────────────────────────────────────────┤
│                    层级 2: 追踪层                      │
│         eBPF tracing programs (内核态)                 │
│    ┌────────────────────────────────────────────┐     │
│    │  tracepoint/raw_syscalls/sys_exit_execve  │     │
│    │  kprobe/__x64_sys_execve                   │     │
│    │  uprobe (用户态函数探测)                      │     │
│    └────────────────────────────────────────────┘     │
│                    ↕ perf buffer                      │
├──────────────────────────────────────────────────────┤
│                    层级 1: 基础层                       │
│         eBPF map（内核态数据存储）                       │
│    ┌────────────────────────────────────────────┐     │
│    │  process昉 map（进程树缓存）                  │     │
│    │  process_creds（进程凭证快照）                │     │
│    │  process_kill（需 kill 的 PID 列表）         │     │
│    │  sensor config map（策略配置）               │     │
│    └────────────────────────────────────────────┘     │
└──────────────────────────────────────────────────────┘

3.3 核心场景一：容器逃逸检测与阻断

容器逃逸是云原生安全最危险的攻击向量。典型手法包括：

写入 /proc/self/root 覆盖宿主机文件系统
通过 cgroup v1 release_agent 触发宿主机命令执行
挂载宿主机的 / 目录到容器内

Tetragon 通过 eBPF hook 监控这些危险操作的 syscall 参数：

// Tetragon TracingPolicy 示例：检测容器逃逸
apiVersion: cilium.io/v1alpha1
kind: TracingPolicy
metadata:
  name: "container-escape-detection"
spec:
  kprobes:
  - call: "security_file_open"
    syscall: false
    return: true
    args:
    - index: 0
      type: "file"  # 打开的文件路径
    - index: 1
      type: "flags" # 打开标志
    selectors:
    - matchArgs:
      - index: 0
        operator: "Equal"
        values:
        - "/etc/hosts"
        - "/proc/self/mountinfo"
        - "/sys/kernel/security"
      matchActions:
      - action: Log
        rateLimit: 1s
      - action: SigKill
        # 容器内进程直接 SIGKILL，无法继续执行逃逸代码

关键在于 security_file_open 这个 LSM（Linux Security Module）hook。Tetragon 挂载在 LSM hook 上，能够在文件被打开的安全决策点拦截——比 Falco 在 openat 系统调用处拦截更早、更安全。

3.4 核心场景二：敏感数据访问追踪

当一个部署在 Kubernetes 中的微服务尝试访问 /etc/shadow 或数据库凭证文件时，Tetragon 不仅能检测到这次访问，还能追踪完整的调用链：

{
  "process_exec": {
    "process": {
      "exec_id": "31762-18432-1712345678901",
      "pid": 8842,
      "uid": 1000,
      "binary": "/usr/bin/cat",
      "command_line": "cat /var/run/secrets/kubernetes.io/serviceaccount/token",
      "parent": {
        "pid": 8841,
        "binary": "/bin/sh",
        "command_line": "sh -c curl https://vault.internal/v1/secret/db"
      }
    },
    "timestamp": "2026-04-20T09:15:32.123Z",
    "event": "execve"
  }
}

这个 JSON 事件包含了完整的进程血统（Process Lineage）：谁启动了谁、命令参数是什么、UID/GID 是什么。有了这个信息，安全团队可以在事件发生后完全复现攻击路径——这在传统安全方案中几乎不可能做到。

3.5 核心场景三：网络连接的安全上下文注入

2026 年 4 月，Tetragon v1.6.0 引入了 CLONE event 机制（commit 215c949），解决了非 fork() 方式创建进程时的信息缺失问题：

正常进程创建路径：
  fork() → CLONE event (内部记录) → execve() → exec event (上报)

线程/协程创建路径（修复后）：
  clone() with CLONE_THREAD → CLONE event (上报到 gRPC) → ...

这一修复的意义在于：当一个 Web 服务器通过线程池处理请求时，每个线程的创建都会被 Tetragon 追踪记录。结合 getattr 网络事件，Tetragon 现在可以追踪每个 TCP 连接对应的完整进程上下文——包括该连接是由哪个线程处理的。

四、Cilium + Tetragon：统一架构的工程价值

4.1 为什么两者结合是 1+1 > 2

Cilium 和 Tetragon 看似是独立项目，但它们的底层基础设施完全共享：

共享层	Cilium 的使用方式	Tetragon 的使用方式
eBPF 运行时	网络数据包处理	系统调用追踪
eBPF Maps	路由/NAT/CT 表	进程树/凭证缓存
Cilium 库	共享 eBPF 程序加载逻辑	复用 libbpf 基础设施
容器元数据	通过 Kubernetes API 获取	通过 Cilium Endpoint 获取

两者都基于 Cilium 的 eBPF 库（bpf/lib/），意味着同一套内核程序基础设施，两套安全视角：Cilium 负责"网络能否通"，Tetragon 负责"这个操作是否安全"。

4.2 统一策略管理：CiliumNetworkPolicy + TracingPolicy

在生产环境中，最理想的架构是安全策略统一管理：

# 统一的安全策略：网络层 + 运行时层联动
---
apiVersion: "cilium.io/v2"
kind: CiliumNetworkPolicy
metadata:
  name: "payment-service-policy"
spec:
  endpointSelector:
    matchLabels:
      app: payment-service
  ingress:
  - fromEndpoints:
    - matchLabels:
        app: api-gateway
    toPorts:
    - port: "8080"
      protocol: TCP
      rules:
        HTTP:
        - method: "POST"
          path: "/v1/payment"
    # L7 策略：只允许特定 HTTP 方法和路径
---
apiVersion: "cilium.io/v1alpha1"
kind: TracingPolicy
metadata:
  name: "payment-service-runtime"
spec:
  podSelector:
    matchLabels:
      app: payment-service
  kprobes:
  - call: "security_file_open"
    return: true
    args:
    - { index: 0, type: "file" }
    selectors:
    - matchArgs:
      - index: 0
        operator: "Prefix"
        values:
        - "/etc/shadow"
        - "/var/run/secrets"
      matchActions:
      - action: SigKill
        rateLimit: 1s

这两条策略联合使用，实现了**"通且安全"**的保障：只有来自 API Gateway 的流量能访问支付服务，同时即便访问路径正确，任何读取敏感文件的操作都会被内核级阻断。

4.3 Hubble：可观测性的 eBPF 实现

Cilium 配套的可观测性组件 Hubble 同样基于 eBPF，实现了零侵入的服务流量可视化：

# 查看所有南北向流量的实时视图
$ kubectl exec -n kube-system ds/cilium -- hubble observe --from-type WORLD

# 输出示例：
# Apr 20 09:20:15.123  10.244.0.42:8080 <- 192.168.1.100:54321  TCP SYN
# Apr 20 09:20:15.124  10.244.0.42:8080 -> 192.168.1.100:54321  TCP SYN-ACK
# Apr 20 09:20:15.125  10.244.0.42:8080 <- 192.168.1.100:54321  TCP ACK
# Apr 20 09:20:15.130  10.244.0.42:8080 <- 192.168.1.100:54321  HTTP/1.1 POST /api/payment
# Apr 20 09:20:15.145  10.244.0.42:8080 -> 192.168.1.100:54321  HTTP/1.1 200 OK (1583 bytes)

Hubble 的独特之处在于：所有流量数据都是在 eBPF 中直接捕获的，不需要在 Pod 中注入 sidecar 代理。这意味着：

零额外资源消耗：没有 sidecar 进程运行在每个 Pod 中
100% 连接可见性：包括被 iptables/DROP 的包（eBPF 在更底层）
L7 解码能力：HTTP、gRPC、Kafka、DNS 等协议可直接解码

五、2026 年新动态：Linux 7.0 内核与 eBPF 生态

5.1 Linux 7.0 对 eBPF 的关键增强

2026 年 4 月 12 日发布的 Linux 7.0 内核为 eBPF 带来了多项战略性改进，直接影响了 Cilium 和 Tetragon 的能力边界：

1. eBPF 循环处理正式稳定化

此前，内核中的 eBPF 循环一直是受限功能。Linux 7.0 正式稳定化了受限循环（bounded loops），这对 Cilium 的路由查找和数据包转发逻辑有重大意义：

// Linux 7.0：eBPF 程序中可以安全使用循环（受限）
// 之前需要 unroll pragma 强制展开
#pragma clang loop unroll(disable)  // 启用真正的循环

for (int i = 0; i < MAX_HOPS; i++) {
    struct rt_entry *rt = lookup_route(ctx, hops[i]);
    if (!rt)
        return DROP_NO_ROUTE;
    ctx = redirect_to_endpoint(rt->endpoint_id);
}

2. XFS eBPF 集成

Linux 7.0 中 XFS 文件系统引入了 xfs_healer 守护进程，虽然这是一个独立的文件系统自愈机制，但它展示了 Linux 7.0 时代内核各子系统与 eBPF 深度集成的趋势。

3. 第四届 eBPF 开发者大会（2026年4月19日，西安）

2026年4月19日，第四届 eBPF 开发者大会在西安召开，CSDN、Bilibili、视频号三大平台同步直播，32 位开发者带来 28 场主题演讲。这次大会的重点议题包括：

Cilium 2.0 的 Multi-Cluster 增强
Tetragon v1.7 的 ML-based 异常检测集成
eBPF 在 AI 推理服务网络加速中的应用

5.2 Cilium v1.20 的核心更新

根据云原生周刊（CSDN，2026-04-14）的报道，Cilium v1.20 的主要更新方向：

Gateway API 全面对齐：与上游 Gateway API v1.0 规范完全对齐，新增 HTTPRoute 增强功能
BGP Control Plane 增强：支持更精细的路由策略和路径属性控制
ClusterMesh 改进：多集群服务发现和负载均衡能力提升
eBPF 性能优化：新增 socket-level 负载均衡路径，进一步减少转发延迟

5.3 Tetragon v1.6 的核心更新

Tetragon v1.6.0（GitHub，2026-04-15）的关键修复：

Graceful Shutdown 改进：修复了 Tetragon 退出时总是返回 exit code 1 的问题，使容器管理器不再误判 Tetragon 为失败进程
CLONE Event 机制：为非 fork() 方式创建的进程（直接 clone）补全了进程追踪信息

六、生产环境部署实战

6.1 最小化安装 Cilium + Hubble

# 1. 通过 Helm 安装（生产推荐）
helm install cilium cilium/cilium \
  --namespace kube-system \
  --set kubeProxyReplacement=strict \
  --set bpf.masquerade=true \
  --set hubble.enabled=true \
  --set hubble.relay.enabled=true \
  --set hubble.ui.enabled=true \
  --set ebpflinuxVersion=7.0 \
  --set operator.replicas=2

# 2. 验证安装
kubectl get pods -n kube-system -l k8s-app=cilium
# NAME               READY   STATUS    RESTARTS   AGE
# cilium-xxxxx       1/1     Running   0          45s

# 3. 安装 Hubble CLI
curl -L --proto '=https' --tlsv1.2 -sSfL https://github.com/cilium/hubble/releases/latest/download/hubble-linux-amd64.tar.gz | tar xvz

# 4. 验证 Hubble 连通性
hubble status
# Node: kind-worker
# Address: 10.0.0.42:4244
# CONNECTED   2m42s ago

6.2 安装 Tetragon 并与 Cilium 集成

# 1. 安装 Tetragon operator
helm install tetragon cilium/tetragon \
  --namespace kube-system \
  --set export.filepath=/var/run/cilium/hubble/events.sock \
  --set tetragon.grpc.address=unix:///var/run/cilium/tetragon/tetragon.sock

# 2. 创建 TracingPolicy（检测 ssh 密钥读取）
cat <<'EOF' | kubectl apply -f -
apiVersion: cilium.io/v1alpha1
kind: TracingPolicy
metadata:
  name: "detect-ssh-key-access"
spec:
  kprobes:
  - call: "security_file_open"
    syscall: false
    return: true
    args:
    - index: 0
      type: "string"
    selectors:
    - matchArgs:
      - index: 0
        operator: "Equal"
        values:
        - "/home/user/.ssh/id_rsa"
        - "/root/.ssh/authorized_keys"
      matchActions:
      - action: SigKill
        rateLimit: 1s
      - action: PostNotify
EOF

# 3. 验证策略生效
kubectl get tsp -n kube-system
# NAME                    ENABLED   AGE
# detect-ssh-key-access   true      10s

6.3 Hubble 可视化：实时追踪服务间流量

# 查看所有外部入站流量
hubble observe --type ingress --node kind-worker

# 筛选特定命名空间的 L7 HTTP 流量
hubble observe \
  --namespace production \
  --protocol http \
  --verbose

# 完整输出：
# Apr 20 09:21:05  10.244.1.15:8080 -> 10.244.2.30:9090  HTTP/1.1 GET /metrics
#   src_pod: prometheus-7f9d8c5b9-x2kzp
#   dst_pod: payment-service-6c7d4f8b-q4lmn
#   verdict: FORWARDED (policy: allow)
#   l7.protocol: http
#   http.method: GET
#   http.path: /metrics

这个输出直接证明了 Cilium 的 L7 策略在 eBPF 层已生效——数据包是否放行由 eBPF 程序在 kernel 空间判断，Kubernetes API Server 完全没有参与数据路径。

七、性能优化与生产调优

7.1 eBPF Map 调优

eBPF Map 是整个系统的数据心脏。生产环境中，以下参数需要根据集群规模调优：

# cilium-config.yaml 中的 eBPF Map 配置
apiVersion: v1
kind: ConfigMap
metadata:
  name: cilium-config
data:
  # 连接追踪表大小（默认值通常不足）
  bpf-ct-global-max-entries: "4000000"
  
  # NAT 表大小（支持更多 SNAT/DNAT 条目）
  bpf-nat-max-entries: "2000000"
  
  # 策略表大小
  bpf-policy-map-max: "16384"
  
  # 是否启用 CT TCP 自动清理
  bpf-ct-timeout-regular: "86400"
  bpf-ct-timeout-service: "3600"
  
  # 启用 neighbor 表格加速
  bpf-neigh-max-entries: "512000"

7.2 HugePages 配置

eBPF verifier 在加载 BPF 程序时需要分配内存，HugePages 能显著减少内存碎片和分配延迟：

# 在 kubelet 配置中启用
cat /etc/kubernetes/kubelet.conf
# ...
KUBELET_EXTRA_ARGS="--reserved-memory=type=memory,size=2Gi,hugepages=10Gi"

# 验证 HugePages
cat /sys/kernel/mm/hugepages/hugepages-2048kB/nr_hugepages
# 5120  (表示 5120 * 2MB = 10GB)

7.3 Cilium 的 CPU 亲和性

eBPF 程序运行在中断上下文中，应尽量绑定到专用的 CPU 核：

# 将 cilium-agent 绑定到特定 CPU 节点
kubectl -n kube-system set env daemonset/cilium \
  CPU_AFFINITY="0-7,16-23"  # 使用 16 核 CPU
  
# 或者通过 systemd 亲和性设置（物理机部署）
systemctl edit cilium-agent

八、总结与展望

8.1 核心价值回顾

eBPF 正在改变云原生的底层逻辑，原因有三：

性能范式转移：从 O(n) 链表遍历到 O(1) HashMap 查找，网络转发不再受 iptables 规模诅咒
安全范式转移：从异步告警到同步内核拦截，安全策略在 syscall 发生的同一时刻生效
可观测性范式转移：从 sidecar 注入到内核级透明捕获，可观测数据不再产生额外的资源开销

Cilium 解决了"网络怎么通"的问题，Tetragon 解决了"这个通是否安全"的问题，Hubble 解决了"我们能看到什么"的问题。三者共同构建了一个基于 eBPF 的内核级云原生基础设施层。

8.2 未来趋势

2026 年下半年，值得关注的演进方向：

eBPF + AI：用 eBPF 追踪 AI 推理服务的请求延迟分布，自动识别 GPU 调度瓶颈
Cilium 的服务网格集成：Cilium + Envoy 的深度整合，逐渐替代 Istio 的 sidecar 模式
Tetragon ML 模块：用机器学习分析进程行为基线，自动识别 0-day 攻击的异常模式
eBPF for Windows：微软正在推进 Windows eBPF 子系统，Cilium/Tetragon 有望扩展到混合集群

8.3 给工程师的建议

如果你在负责大规模 Kubernetes 集群的运维或安全：

网络层面：优先用 Cilium 替换 kube-proxy，尤其在集群规模超过 100 节点或 Service 数超过 500 时
安全层面：Tetragon 是当前最强的容器运行时安全方案，建议在合规要求高的环境（如金融、政务）优先部署
可观测性：Hubble + Cilium 的组合可以替代至少 60% 的 Istio sidecar 流量监控能力，同时资源消耗降低 80%

eBPF 不是银弹，但它确实是 Linux 内核自 2000 年代初引入 Netfilter 以来，对网络、安全和可观测性领域影响最深远的底层技术创新。在 2026 年这个时间点，它已经足够成熟、足够稳定、足够有生态支撑——值得每个云原生工程师深入了解并逐步落地。

参考资源：

本文首发于程序员茄子（chenxutan.com），禁止未经授权的转载。

编程 从 Cilium 到 Tetragon：eBPF 如何重塑云原生网络、安全与可观测性的统一架构