Apache Cloudberry 2.1.0 发布:面向分析与 AI 工作负载的 PostgreSQL MPP 数据库

发布于 2026-04-19,Apache Cloudberry
相关开源软件

Apache Cloudberry(孵化中)社区宣布发布 Apache Cloudberry 2.1.0,这是其面向大规模分析与 AI 工作负载的 MPP 数据库最新版本。

继 2.0.0 成为进入 Apache 孵化器后的首个正式版本后,2.1.0 继续增强数据库内核、执行引擎以及周边生态组件。

2.1.0 主要增强

  • 分布式执行增强:新增 UDP2 互连协议,提高 segment 之间的通信效率,提升分布式查询的性能与扩展性。
  • 优化器改进:ORCA 优化器加入 CTE 裁剪、部分聚合下推,以及多项正确性与内存相关修复。
  • 存储与性能优化:PAX 存储格式新增 LZ4 压缩支持,并改进 I/O 与内存管理。
  • 更快的统计信息收集:为 append-optimized 表提供 fast ANALYZE,缓解大规模环境中的常见运维瓶颈。
  • 更好地接入现代数据工作流:引入 MCP 服务器,便于与基于 LLM 的工具和 AI 工作流集成。

生态组件更新

  • Cloudberry PXF:代码库现代化、依赖更新,并与 Apache 项目标准对齐。
  • Cloudberry Backup:备份工具链完成整合,S3 插件并入主仓库,可维护性进一步提升。

项目也在持续推进 PostgreSQL 内核从 14.x 向 16.x 的升级,并进一步加强与 PostgreSQL 生态的集成。

相关链接

关于 Apache Cloudberry

Apache Cloudberry(孵化中)是一个面向大规模数据分析的开源 MPP 数据库,源自 PostgreSQL 与 Greenplum Database 最后一个开源版本,支持本地与云端部署,可为数据仓库和高级分析场景提供可扩展基础。