编程 XTDB 深度实战：当数据库学会了时间旅行——从双时态模型到 LSM-Tree 存储引擎、从 SQL:2011 到 PostgreSQL 兼容的生产级完全指南（2026）

2026-06-20 08:09:09 +0800 CST views 14

XTDB 深度实战：当数据库学会了时间旅行——从双时态模型到 LSM-Tree 存储引擎、从 SQL:2011 到 PostgreSQL 兼容的生产级完全指南（2026）

前言：一个被遗忘的数据库本质问题

你有没有想过这个问题——"上周五下午5点，根据当时我们掌握的信息，客户的账户余额是多少？"

注意这个问题的精妙之处：它问的不是"上周五下午5点客户的实际余额"，而是"根据当时我们掌握的信息"。这两者之间的差距，可能是一笔延迟入账的转账、一个事后修正的错误录入、或者一份补传的历史数据。

在传统数据库中，这类问题几乎无解。你的 updated_at 列只记录了最后一次修改时间，soft_delete 标记抹去了被删除记录的存在痕迹，而那些为了满足审计合规而建的各种 xxx_history 表，往往在关键时刻缺了最关键的那一条记录。

2026 年，一家名为 JUXT 的英国公司给出的答案是 XTDB——一个从第一天起就把"时间"作为第一公民的数据库。它不只是在传统关系模型上打补丁，而是将 SQL:2011 标准中的双时态（bitemporal）语义内建到数据库的每一个写入操作中。更关键的是，XTDB 2.x 完全兼容 PostgreSQL wire protocol，这意味着你现有的 psql、JDBC、ORM 工具链可以直接连接，零迁移成本。

这篇文章，我会从双时态的基本概念出发，深入 XTDB 的架构设计、存储引擎、SQL 兼容层，然后通过完整的代码实战带你理解：为什么"时间旅行"不只是一个酷炫的功能，而是现代数据系统的基础能力。最后，我会分享在生产环境中部署和优化 XTDB 的经验教训。

一、为什么你的数据库需要"时间旅行"

1.1 传统方案的困境

在绝大多数生产系统中，"记录历史"这件事是通过以下方式实现的：

方案A：软删除

UPDATE orders SET is_deleted = true, deleted_at = NOW() WHERE id = 123;

问题：查询时必须到处加 WHERE is_deleted = false，JOIN 时忘加一个就出 bug。更致命的是，软删除只能告诉你"这条记录现在被标记为删除了"，无法告诉你"上周三这条记录的值是什么"。当你在做历史数据分析时，这种"当前状态优先"的设计就成了最大的阻碍。

还有更隐蔽的问题：当一条记录被软删除后又重新激活，你的 updated_at 时间戳会跳变，但中间删除期间的数据状态完全丢失了。如果你需要回答"这条记录在删除期间是否被其他系统引用"，你只能靠猜测。

方案B：审计表

CREATE TABLE orders_history (
    id BIGINT,
    order_no VARCHAR(64),
    amount DECIMAL(10,2),
    status VARCHAR(32),
    changed_at TIMESTAMP,
    changed_by VARCHAR(64),
    change_type VARCHAR(16)
);

问题：审计表和业务表的一致性谁来保证？应用层双写有遗漏风险，触发器有性能开销。更关键的是，查询时需要将业务表和审计表 UNION，SQL 复杂度指数级上升。我曾见过一个金融系统的审计查询，涉及 7 张业务表和 7 张审计表的 14 路 JOIN，执行计划复杂到 DBA 都看不懂。

方案C：事件溯源（Event Sourcing）

OrderCreated { order_no: "ORD-001", amount: 99.9 }
OrderAmountUpdated { order_no: "ORD-001", old_amount: 99.9, new_amount: 89.9 }
OrderStatusChanged { order_no: "ORD-001", old_status: "pending", new_status: "shipped" }

问题：事件溯源本身是正确的思路，但实现成本极高。你需要自己管理事件存储、快照、投影，最终往往是在应用层重新实现了一个数据库。Martin Fowler 本人都说过，事件溯源的复杂度被严重低估了。

1.2 双时态：被 SQL 标准定义了15年却鲜有人用的能力

SQL:2011 标准定义了两种时间维度：

System Time（系统时间）：数据库何时知道这条记录的值。即记录被写入数据库的时间。
Application Time / Valid Time（有效时间）：这条记录在现实世界中何时为真。即业务语义上的有效期。

这两个维度的组合就是双时态（bitemporal）。一个双时态数据库中的每条记录，不仅有主键和值，还有四个隐藏的时间戳：

  _id  | name | amount | _system_from | _system_to  | _valid_from | _valid_to
-------+------+--------+--------------+-------------+-------------+-----------
   1   | foo  | 100    | 2026-01-01   | 2026-01-05  | 2026-01-01  | 9999-12-31
   1   | foo  | 150    | 2026-01-05   | 9999-12-31  | 2026-01-05  | 9999-12-31

第一行表示：从1月1日到1月5日，数据库"认为" foo 的金额是 100（有效期从1月1日开始）。第二行表示：从1月5日起，数据库"知道" foo 的金额从1月5日起变成了 150。

这意味着你可以回答这两种问题：

"1月3日时，我们认为 foo 的金额是多少？" → 100（基于 system_time 和 valid_time 的交叉查询）
"1月6日时，我们认为 foo 在1月3日的金额是多少？" → 还是 100

但如果1月8日我们发现1月3日录入的数据有误并做了修正：
3. "1月10日时，我们认为 foo 在1月3日的金额是多少？" → 修正后的值

这种能力在金融、保险、医疗等场景中是刚需，而不是锦上添花。

PostgreSQL 从 9.2 开始支持 temporal tables，但你需要对每张表显式启用 PERIOD FOR SYSTEM_TIME，而且 Valid Time 需要手动管理。更关键的是，PostgreSQL 的 temporal tables 只能查询历史，不能处理"后补的历史数据"和"对历史的修正"——而这恰恰是双时态最核心的价值。

1.3 XTDB 的不同之处

XTDB 把双时态从"可选特性"变成了"默认行为"：

所有写入自动版本化——不需要建审计表、不需要软删除、不需要触发器
UPDATE 和 DELETE 是非破坏性的——旧版本永远保留，除非你显式 ERASE
Valid Time 原生支持——可以处理延迟到达的数据和事后修正
PostgreSQL 兼容——通过 PostgreSQL wire protocol 连接，现有工具和驱动直接可用
动态 Schema——不需要预先建表，INSERT 时自动推断列名和类型
嵌套文档原生支持——JSON 风格的嵌套数据作为一等公民

二、双时态模型深度解析

2.1 System Time 详解

System Time 回答的问题是"数据库何时知道了这条信息"。它是数据库内部的、不可篡改的时间维度。

在 XTDB 中，每条记录有两个系统时间列：

_system_from：这条版本何时被写入数据库
_system_to：这条版本何时被新版本替代（9999-12-31 表示当前版本）

System Time 的关键特性：

严格单调递增：由于 XTDB 使用全局序列化的写入日志，_system_from 必然是严格递增的。这保证了时间线的无歧义性。

不可修改：应用层无法直接设置或修改 _system_from 和 _system_to。这两个值由数据库在写入时自动维护。

查询语法：

-- 查看某张表的完整系统时间历史
SELECT * FROM accounts FOR SYSTEM_TIME ALL;

-- 查询特定时间点的数据快照
SELECT * FROM accounts FOR SYSTEM_TIME AS OF '2026-01-15T00:00:00';

-- 查询时间范围内的数据版本
SELECT * FROM accounts FOR SYSTEM_TIME BETWEEN '2026-01-01' AND '2026-01-31';

2.2 Valid Time 详解

Valid Time 回答的问题是"这条数据在现实中何时为真"。它是业务语义的、由应用层控制的时间维度。

与 System Time 不同，Valid Time 的两个列是应用层可控的：

_valid_from：这条数据在现实中开始生效的时间（默认为写入时间）
_valid_to：这条数据在现实中失效的时间（默认为 9999-12-31）

Valid Time 的关键特性：

应用层控制：可以在 INSERT 时指定 _valid_from，实现延迟入账和未来调度。

允许乱序：同一 _id 的不同 Valid Time 版本可以以任意顺序写入。

修正机制：通过设置 _valid_to 可以"关闭"一个有效时间段，然后插入新的修正版本。

2.3 双时态矩阵：两个维度的交叉

双时态的真正威力在于两个维度的交叉查询。我们可以用一个二维矩阵来理解：

                    Valid Time (业务时间)
                    1月1日    1月5日    1月10日
System    1月1日   | 100  |    -    |    -     |
Time      1月5日   | 100  |  150   |    -     |
(认知时间) 1月10日  | 200* |  150   |   180    |

* 1月10日修正了1月1日的值为200

这个矩阵的每一个单元格都是一个可查询的状态。你可以问：

"1月5日时，我们认为1月1日的金额是多少？" → 100
"1月10日时，我们认为1月1日的金额是多少？" → 200（被修正了）

在传统数据库中，这个矩阵只有一个切片——"当前时间认为的当前状态"。而双时态数据库保留了整个矩阵。

2.4 与时序数据库的区别

很多人会把双时态和时序数据库（InfluxDB、TimescaleDB、TDengine）混淆。它们解决的是不同的问题：

双时态数据库：数据模型是带版本的实体，查询模式是"某时某刻某实体的状态"，核心操作是修正和回溯
时序数据库：数据模型是时间戳+度量值，查询模式是"某时间范围的聚合值"，核心操作是采集和降采样

简单来说：时序数据库回答"温度传感器在过去一小时的平均温度"，双时态数据库回答"上周五时，根据当时的信息，客户的信用评级是什么"。

三、XTDB 核心架构深度解析

3.1 整体架构

XTDB 的架构分为以下几层：

Client Layer: psql / JDBC / any PostgreSQL-compatible driver
    ↓
PostgreSQL Wire Protocol (SERIALIZABLE isolation, stateless connections)
    ↓
Query Engine: SQL parser → logical plan → physical plan → exec
    ↓
Indexer: Log consumption → Apache Arrow chunks → LSM-Tree
    ↓
Storage Layer: Local (SQLite/In-Memory) | Remote (Object Storage)
    ↓
Transaction Log: Append-only, single-writer, fully serialized

关键设计决策：

单写入者 + 全序列化日志：XTDB 强制所有写入操作序列化到一条全局日志中。这意味着没有分布式锁、没有并发冲突检测、没有乐观并发控制的事务回滚——因为写入本身就不会冲突。这个设计直接受益于 Jay Kreps（Kafka 联合创始人）那篇著名的文章"The Log"。

无状态连接：客户端连接到 XTDB 是无状态的。你不能在一个事务中先查询再写入——所有操作必须在一个批处理中提交。这消除了长时间持有锁的问题，也意味着 XTDB 天然适合无服务器架构。

3.2 存储引擎：基于 Apache Arrow 的 LSM-Tree

XTDB 的存储引擎选择了一条独特的路线：LSM-Tree + Apache Arrow 列式格式。

传统的 LSM-Tree（如 RocksDB、LevelDB）使用行式存储，每次 compaction 都需要反序列化-合并-再序列化。XTDB 则利用 Apache Arrow 的零拷贝列式格式，让 compaction 可以直接在列级别操作。

这个设计带来了几个优势：

向量化的时态查询：由于数据按列存储，查询 _system_from 和 _valid_from 只需扫描对应列，不需要读取整行数据。对于时态过滤查询的性能提升是数量级的。
高效的 compaction：列式存储允许按时间范围分区合并，双时态的历史版本天然形成时间分区。Compaction 不需要反序列化数据，直接操作 Arrow 的列向量即可。
与对象存储的天然契合：Apache Arrow 的内存映射文件可以直接作为对象存储的 block，避免数据格式转换。
ADBC 协议支持：Apache Arrow Database Connectivity 允许使用 Arrow 原生协议进行高效数据传输，避免了 JDBC/ODBC 的序列化开销。

3.3 对象存储优先的设计

XTDB 的远程存储层直接构建在对象存储（S3、GCS、Azure Blob）之上：

对象存储布局:
├── xt-telemetry/          # 遥测数据
├── xt-tx-log/             # 事务日志
│   ├── chunk-00001/       # 日志分片
│   │   ├── log-leaves/    # 日志叶节点 (Arrow 格式)
│   │   └── log-meta/      # 日志元数据
│   └── chunk-00002/
├── xt-indexes/            # 索引数据
│   ├── release-20260101/  # 索引版本
│   │   ├── table-people/  # 按表分区的索引
│   │   └── table-orders/
│   └── release-20260102/
└── xt-snapshot/           # 快照数据

每个日志分片和索引版本都是不可变的对象。这意味着：

读取历史数据不需要任何回滚操作，直接读取对应时间点的索引版本
Compaction 产生新索引版本，旧版本作为不可变对象继续存在
成本优化：历史索引可以放在低成本存储类
读写分离变得极其简单：读节点只需消费日志、构建索引、响应查询

四、XTDB SQL 深度实战

4.1 安装与启动

# Docker 一键启动
docker run -p 5432:5432 ghcr.io/xtdb/xtdb

# 用 psql 连接
psql -h localhost xtdb -c "SELECT 42"

4.2 动态 Schema 与灵活类型

XTDB 不要求预先定义表结构：

-- 直接 INSERT，表和列自动创建
INSERT INTO people (_id, name, age) VALUES (1, 'Alice', 30);

-- 稍后插入不同形状的数据，Schema 自动扩展
INSERT INTO people (_id, name, age, email) VALUES (2, 'Bob', 25, 'bob@example.com');

-- 查看推断出的 Schema
SELECT table_name, column_name, data_type
FROM information_schema.columns WHERE table_name = 'people';

id 是 XTDB 中唯一必须的列，作为主键使用。 前缀是 XTDB 保留列的约定。

4.3 嵌套文档与 RECORDS 语法

XTDB 原生支持 JSON 风格的嵌套数据：

-- 使用 RECORDS 语法插入嵌套数据（upsert 语义）
INSERT INTO people (_id, name, RECORDS {address: {city: 'Beijing', zip: '100000'}})
VALUES (1, 'Alice', {});

-- 查询嵌套字段
SELECT p.name, p.address.city, p.address.zip FROM people p;
-- Alice | Beijing | 100000

4.4 System Time：不可变的时间线

所有的 INSERT、UPDATE、DELETE 都会自动记录系统时间。DELETE 只是在当前时间点标记了一条"被删除"的版本，而非真正删除：

-- 查看完整的系统时间历史
SELECT _id, owner, balance, _system_from, _system_to
FROM accounts FOR SYSTEM_TIME ALL;

-- 时间旅行查询
SELECT * FROM accounts FOR SYSTEM_TIME AS OF '2026-01-03T00:00:00';

-- 恢复被删除的记录
INSERT INTO accounts (_id, owner, balance) VALUES (1, 'Alice', 1500);

Basis 概念：设置 DEFAULT SYSTEM_TIME 可以让整个会话的所有查询都基于同一个时间点：

SET DEFAULT SYSTEM_TIME = '2026-01-03T00:00:00';
SELECT * FROM accounts;      -- 看到的是1月3日的数据
SELECT * FROM orders;        -- 也是1月3日的数据

这对分布式读副本尤其重要：无论连接到哪个 XTDB 节点，相同 basis 的查询一定返回相同结果。

4.5 Valid Time：业务时间的精确表达

延迟入账：

-- 1月5日录入一笔1月2日发生的存款
INSERT INTO transactions (_id, type, amount, _valid_from)
VALUES (1, 'deposit', 500, '2026-01-02T00:00:00');

事后修正：

-- 关闭旧版本
INSERT INTO transactions (_id, type, amount, _valid_from, _valid_to)
VALUES (1, 'deposit', 500, '2026-01-02', '2026-01-15');

-- 插入修正版本
INSERT INTO transactions (_id, type, amount, _valid_from)
VALUES (1, 'deposit', 550, '2026-01-02');

现在你可以回答：

"1月10日时，我们认为1月2日的存款是多少？" → 500（基于1月10日的认知）
"1月20日时，我们认为1月2日的存款是多少？" → 550（基于1月20日的认知）

4.6 ERASE：真正的数据删除

ERASE FROM accounts WHERE _id = 1;

ERASE 操作会在事务提交后立即生效，后台索引处理完成后从对象存储中彻底移除。满足 GDPR 合规需求。

4.7 全局调度：未来数据的自动生效

-- 提前录入一条1月20日才生效的费率
INSERT INTO rates (_id, plan, price, _valid_from)
VALUES (1, 'premium', 29.99, '2026-01-20T00:00:00');

-- 1月19日查询：看不到
-- 1月20日查询：自动出现

不需要 cron job，数据库本身就是调度器。

4.8 事务日志

XTDB 维护了系统表 xt.txs，记录所有事务的完整历史：

SELECT * FROM xt.txs ORDER BY _system_from DESC LIMIT 10;

五、生产级部署与性能优化

5.1 Docker Compose 生产配置

version: "3.8"
services:
  xtdb:
    image: ghcr.io/xtdb/xtdb:latest
    ports:
      - "5432:5432"
    environment:
      XTDB_LOCAL_DIR: /var/lib/xtdb
      XTDB_S3_BUCKET: my-xtdb-data
      XTDB_S3_PREFIX: prod
      XTDB_S3_REGION: us-east-1
    volumes:
      - xtdb-local:/var/lib/xtdb
    deploy:
      resources:
        limits:
          memory: 4G

volumes:
  xtdb-local:

5.2 写入性能优化

批量提交：将多个写入操作合并到一个事务中。XTDB 的事务是原子性的——批量提交减少日志写入次数，大幅提升吞吐。

控制 Valid Time 粒度：如果业务不需要微秒级 Valid Time，使用天级粒度减少版本数量：

-- 推荐：天级粒度
INSERT INTO daily_rates (_id, rate, _valid_from) VALUES (1, 6.85, '2026-01-20');

避免不必要的 ERASE：ERASE 会触发后台索引重建，频繁 ERASE 严重影响性能。

5.3 读取性能优化

利用 Basis 实现读写分离：

XTDB 的日志是追加式的，读取历史数据不需要任何锁。你可以设置独立读节点，使用固定 basis 查询：

import psycopg

# 读取连接（固定 basis）
read_conn = psycopg.connect("host=xtdb-replica port=5432 dbname=xtdb")
read_cur = read_conn.cursor()
read_cur.execute("SET DEFAULT SYSTEM_TIME = %s", ("2026-01-15T00:00:00",))

5.4 Compaction 策略

LSM-Tree 的 compaction 策略：

Level 0：最新写入，存储在内存
Level 1-N：按时间范围分区，存储在对象存储
超过阈值触发向下一层合并

对于双时态数据的特殊处理：

System Time 严格单调递增，天然有序
Valid Time 可能乱序，compaction 时需要重新排序
合并时正确处理版本覆盖逻辑

5.5 对象存储成本优化

生命周期策略：将超 N 天的索引版本迁移到低频存储
ERASE 旧数据释放存储空间
控制 Compaction 频率以减少历史版本对象

在 AWS 上典型部署成本约 $180-200/月，与自建 PostgreSQL + 审计表方案相当，但省去了应用层审计逻辑的开发和维护成本。

六、应用场景与架构模式

6.1 金融合规：可审计的交易系统

import psycopg
from datetime import datetime

class AuditableAccountService:
    """基于 XTDB 的可审计账户服务"""

    def __init__(self, conn_str: str):
        self.conn = psycopg.connect(conn_str)

    def deposit(self, account_id: int, amount: float,
                effective_date: datetime):
        """存款，支持延迟入账"""
        cur = self.conn.cursor()
        cur.execute(
            "INSERT INTO transactions (_id, account_id, type, amount, _valid_from) "
            "VALUES (%s, %s, %s, %s, %s)",
            (self._next_id(), account_id, "deposit", amount, effective_date)
        )
        self.conn.commit()

    def get_balance_as_of(self, account_id: int,
                          system_time: datetime, valid_time: datetime):
        """双时态余额查询"""
        cur = self.conn.cursor()
        cur.execute("SET DEFAULT SYSTEM_TIME = %s", (system_time,))
        cur.execute(
            "SELECT COALESCE(SUM(amount), 0) FROM transactions "
            "WHERE account_id = %s AND _valid_from <= %s AND _valid_to > %s",
            (account_id, valid_time, valid_time)
        )
        return cur.fetchone()[0]

    def correct_transaction(self, tx_id: int, new_amount: float,
                            correction_time: datetime):
        """修正交易金额"""
        cur = self.conn.cursor()
        cur.execute(
            "UPDATE transactions SET _valid_to = %s WHERE _id = %s",
            (correction_time, tx_id)
        )
        cur.execute(
            "INSERT INTO transactions (_id, account_id, type, amount, _valid_from) "
            "SELECT %s, account_id, type, %s, _valid_from "
            "FROM transactions FOR SYSTEM_TIME ALL WHERE _id = %s LIMIT 1",
            (self._next_id(), new_amount, tx_id)
        )
        self.conn.commit()

6.2 保险理赔：决策审计追溯

-- 创建理赔记录
INSERT INTO claims (_id, policy_id, decision, reason)
VALUES ('CLM-001', 'POL-123', 'approved', 'All documents verified');

-- 发现欺诈，修正决策
INSERT INTO claims (_id, policy_id, decision, reason, _valid_from, _valid_to)
VALUES ('CLM-001', 'POL-123', 'approved', 'All documents verified',
        '2026-01-01', '2026-02-15');

INSERT INTO claims (_id, policy_id, decision, reason, _valid_from)
VALUES ('CLM-001', 'POL-123', 'rejected', 'Fraud detected', '2026-01-01');

-- 2月1日的认知：approved
-- 3月1日的认知：rejected（双时态交叉查询）

6.3 AI Agent 的可观测性层

XTDB 的双时态模型可以充当 AI Agent 的"记忆底座"：

class AgentMemoryStore:
    """基于 XTDB 的 AI Agent 记忆存储"""

    def __init__(self, conn_str: str):
        self.conn = psycopg.connect(conn_str)

    def record_observation(self, agent_id: str, observation: dict,
                           observed_at: datetime):
        cur = self.conn.cursor()
        cur.execute(
            "INSERT INTO agent_observations (_id, agent_id, observation, _valid_from) "
            "VALUES (%s, %s, %s, %s)",
            (f"{agent_id}:{observed_at.isoformat()}", agent_id, observation, observed_at)
        )
        self.conn.commit()

    def get_agent_context_at(self, agent_id: str,
                             system_time: datetime, valid_time: datetime):
        cur = self.conn.cursor()
        cur.execute("SET DEFAULT SYSTEM_TIME = %s", (system_time,))
        cur.execute(
            "SELECT observation FROM agent_observations "
            "WHERE agent_id = %s AND _valid_from <= %s AND _valid_to > %s",
            (agent_id, valid_time, valid_time)
        )
        return [row[0] for row in cur.fetchall()]

6.4 变更数据集成（CDC）

XTDB 原生支持 Debezium 格式的 CDC 数据摄入。典型架构：

PostgreSQL (主库) → Debezium (CDC) → XTDB (审计副本)
                                        ↓
                                   双时态查询 / 合规报告 / 历史回溯

这是最低风险的采纳路径——不需要迁移主库，就能获得双时态能力。

七、XTDB vs 传统方案的对比分析

7.1 与 PostgreSQL Temporal Tables 对比

维度	XTDB	PostgreSQL Temporal Tables
System Time	默认启用，所有表	需要显式创建 temporal table
Valid Time	原生支持，自动版本化	需要手动管理 PERIOD
历史修正	原生支持	不支持（只能追加）
延迟入账	原生支持	需要应用层处理
Schema	动态，无需 DDL	固定，需要 ALTER TABLE
嵌套数据	原生支持（RECORDS）	需要 JSONB
删除恢复	一条 INSERT 即可恢复	需要从备份恢复
存储	对象存储优先	本地磁盘
事务模型	无状态，批处理	有状态，交互式
生态成熟度	新兴	成熟（30+ 年）

7.2 与事件溯源对比

维度	XTDB	Event Sourcing
查询模型	SQL（声明式）	投影（自定义）
时间旅行	内置 SQL 语法	需要重建状态
双时态	原生支持	需要自行实现
开发成本	低	高
一致性	数据库保证	应用层保证
工具生态	PostgreSQL 兼容	自定义

7.3 适用场景判断

适合用 XTDB 的场景：

金融、保险等需要完整审计追踪的行业
监管合规要求严格的系统（GDPR、SOX、Basel III）
需要处理延迟到达数据和事后修正的数据管道
AI Agent 的可观测性层和决策审计
作为现有数据库的"审计副本"（通过 CDC 集成）

不太适合的场景：

超高写入吞吐（单写入者瓶颈）
需要复杂 OLAP 分析——考虑 ClickHouse 或 DuckDB
需要分布式事务——考虑 CockroachDB 或 TiDB
需要交互式事务——考虑 PostgreSQL

八、从 Crux 到 XTDB：一个数据库的进化史

Crux（2019-2021）：XTDB 的前身，使用 Clojure 的 Datalog 作为查询语言。Datalog 在表达力上很强，但学习曲线陡峭，生态有限。
XTDB 1.x（2021-2023）：保留了 Datalog 查询，增加了实验性的 SQL 支持。底层使用 Lucene 作为索引引擎。
XTDB 2.x（2024-至今）：全面转向 SQL，采用 PostgreSQL wire protocol，底层重写为 Apache Arrow + LSM-Tree。这是一个彻底的重构。

这个进化路径反映了一个重要洞察：Datalog 在学术界很优雅，但在生产环境中，SQL 是唯一被广泛接受的标准。XTDB 2.x 的 PostgreSQL 兼容不是"额外功能"，而是核心战略——让现有工具链直接可用，降低迁移成本。

九、局限性与风险

单写入者瓶颈：所有写入序列化到一条日志。高并发写入场景下会成为瓶颈。
无交互式事务：不能在一个事务中先 SELECT 再 INSERT。很多 ORM 框架需要修改应用层代码。
成熟度：XTDB 2.x 是2024年才发布的重写版本。在核心金融系统上使用需要谨慎评估。
社区规模：2.9k GitHub Stars，遇到问题时能找到的参考资料有限。
查询性能：对于不含时间维度的大规模 OLAP 查询，专门的列式数据库可能更快。
运维复杂度：对象存储优先的架构引入了 S3 延迟、网络带宽等新的运维变量。

十、总结与展望

XTDB 回答了一个被行业长期忽视的问题：如果数据库从第一天起就把"时间"当成第一公民，我们的系统会有什么不同？

答案是可以消除大量的应用层复杂度——软删除、审计表、事件溯源框架、自定义版本管理——这些本该是数据库的职责，但传统数据库把负担推给了应用开发者。每一个写过 _history 表的程序员都知道那种痛苦：双写的恐惧、查询的复杂性、合规审查时的手忙脚乱。

XTDB 的核心价值主张可以用一句话概括：SQL that remembers everything。不是通过打补丁实现，而是从存储引擎到查询引擎的全栈设计。

展望未来，XTDB 在以下方向值得关注：

AI Agent 基础设施：随着 Agent 应用爆发，对决策审计和上下文回溯的需求会急剧增长。XTDB 的双时态模型天然适合 Agent 的可观测性层。
Serverless Workers：无状态连接 + 对象存储架构让 XTDB 天然适合无服务器部署。
实时 CDC 集成：作为现有数据库的"审计影子"，不需要迁移主库就能获得双时态能力。
合规即代码：GDPR 的"被遗忘权"通过 ERASE 语法实现，审计需求通过时间旅行查询满足——合规不再是事后的补丁，而是内建的能力。

如果你正在构建一个需要"完美记忆"的系统——金融交易、保险理赔、医疗记录、AI Agent——XTDB 值得认真评估。它可能不会替代你的主数据库，但作为审计层和可观测性层，它能解决你用传统方案永远无法优雅解决的问题。

毕竟，在这个数据驱动的时代，记住一切的成本，远低于遗忘一切的代价。

参考资源：

XTDB 官方文档：https://docs.xtdb.com
XTDB GitHub：https://github.com/xtdb/xtdb
SQL:2011 Temporal Features：ISO/IEC 9075:2011
CMU 数据库课程 - Bitemporal Database（Andy Pavlo 教授演讲，XTDB 官网可找到链接）
LinkedIn Engineering - The Log：https://engineering.linkedin.com/distributed-systems/log-what-every-software-engineer-should-know-about-real-time-datas-unifying