pgEdge 发布 ColdFront for PostgreSQL,无缝统一 AI、分析与 OLTP 工作负载

发布于 2026-06-26,pgEdge, Inc.
相关开源软件

原文:https://www.postgresql.org/about/news/pgedge-announces-coldfront-for-postgresql-seamlessly-uniting-ai-analytical-and-oltp-workloads-3325/ 发布日期:2026-06-26 作者:pgEdge, Inc.

pgEdge 宣布推出 pgEdge ColdFront,这是面向 PostgreSQL 的透明数据分层方案。ColdFront 的冷数据层与许多替代方案不同,归档行仍可通过应用已经使用的同一套 SQL 执行 UPDATEDELETE,无需修改应用代码,也无需先把数据恢复到热存储。旧数据会自动移动到任意兼容 S3 的对象存储中,以 Apache Iceberg / Parquet 格式保存,存储成本最高可降低 90%。完整数据集仍通过同一个 PostgreSQL 表名保持可读写,冷层扫描则借助 DuckDB 的向量化列式引擎获得分析级速度。

生产中的 PostgreSQL 数据库会随着历史数据积累而持续增长,而这些数据往往仍需用于分析和保留合规。存储成本、备份复杂度、vacuum 开销和副本延迟都会上升。ColdFront 让冷数据自动移动到低成本对象存储,同时仍可通过标准 PostgreSQL 读写,并在各层都使用开放格式。

一个简单但常见的例子是对五年前归档数据执行 GDPR 删除请求。使用 ColdFront 时,这是一条 SQL 语句,而不是“恢复到热存储、删除、重新归档、再验证”的流程。冷层默认可写。

ColdFront 的主要特点包括:

  • 直接可写的冷层:归档数据通过同一 PostgreSQL 表名保持完全可写,无需 rehydrate、特殊路径或应用层感知。
  • 冷数据分析速度:DuckDB 在 PostgreSQL 进程内运行,针对 Parquet 冷数据使用向量化列式引擎,官方称在相同数据上可比行式存储快 10-100 倍。
  • 零应用改动:ColdFront 在扩展层拦截 SQL,应用继续对同一个表名执行 SELECTINSERTUPDATEDELETE
  • 全栈开放源代码:运行在标准上游 PostgreSQL 16、17、18 上,不需要专有分叉;冷层数据为标准 Apache Iceberg,可被 Spark、Trino、DuckDB、Snowflake 或 Databricks 读取。
  • 内置分区生命周期管理:通过 hot_period 控制热数据窗口,可选 retention_period 自动删除超过保留期的冷数据,并可提前创建未来分区、并发卸载旧分区。
  • 降低冷数据存储成本与运维复杂度:对象存储成本通常显著低于 SSD 支撑的 PostgreSQL 存储,热层更小也有助于更快备份、恢复并降低副本开销。
  • 通过 Spock 实现天然分布式:在 pgEdge Spock 多主集群中,S3 上的冷数据可被每个节点同时读写,热数据通过 Spock 复制,冷数据位于共享对象存储。

ColdFront 也面向 AI 与机器学习场景。训练、RAG 检索、特征工程和智能体分析通常需要访问完整历史数据,而传统 PostgreSQL 部署可能会删除或归档这些数据。在解耦模式下,ColdFront 可让 PostgreSQL 成为 Iceberg 之上的无状态计算前端,新计算节点可在数秒内连接到同一 catalog 和对象存储。

适用场景包括 SaaS 与 IoT 时序工作负载、长期保留要求严格的金融/医疗/政府行业,以及不想另建专用数据仓库的分析团队。

ColdFront 支持三种存储模式以及独立分区管理器:

  • 分层模式(热 + 冷):近期数据保留在 PostgreSQL heap 分区中,轻量归档器按计划将旧分区移动到 Iceberg。
  • 解耦模式(仅 Iceberg):整张表从第一行开始就位于 Iceberg 中,PostgreSQL 作为无状态计算前端。
  • 仅分区模式(无冷层):在标准 PostgreSQL 上管理分区表生命周期,后续可升级为完整分层。

pgEdge ColdFront 现已作为 beta 版本开放,用于预生产测试和评估。分层与解耦模式已经在覆盖 PostgreSQL 16、17、18 的 CI 矩阵中端到端运行,支持普通部署和多主 Spock mesh 拓扑,包括物理备库读取。支持的存储类型包括 S3 兼容对象存储、Google Cloud Storage 和 Azure Blob Storage(ADLS Gen2)。

ColdFront 将随 pgEdge Enterprise Postgres 捆绑,并计划在 2026 年下半年集成到 pgEdge Cloud。ColdFront 采用 PostgreSQL License 开源,可在标准社区 PostgreSQL 上使用。文档、安装说明和参考架构见:https://docs.pgedge.com/coldfront

了解更多或开始使用:https://github.com/pgEdge/coldfront