PostgreSQL数据库FDW——WIP PostgreSQL Sharding

网友投稿 293 2022-09-19

PostgreSQL数据库FDW——WIP PostgreSQL Sharding

创建此页面是为了概述在 PostgreSQL CORE 中添加分片功能所需的功能。该页面的目的是维护一个待办事项列表,用于在核心中添加分片功能。 合作在 PG 中添加功能的成员可以使用此页面查看此功能的当前状态,还可以查看待办事项列表上的更新。This page is created to outline the features required to add the capability of Sharding in PostgreSQL CORE. The purpose of the page is to maintain a todo list for adding the sharding functionality in the core. The members collaborating on adding the capability in PG can use this page to see the current status of this feature and also see updates on the todo list.

Overview

Sharding in database is the ability to horizontally partition data across one more database shards. It is the mechanism to partition a table across one or more foreign servers. While the declarative partitioning feature allows users to partition tables into multiple partitioned tables living on the same database server, sharding allows tables to be partitioned in a way that the partitions live on external foreign servers and the parent table lives on the primary node where the user is creating the distributed table. The built-in sharding feature in PostgreSQL will use a FDW-based approach. FDW’s are based on the SQL/MED specification that defines how an external data source can be accessed. PostgreSQL provides a number of foreign data wrappers (FDW’s) that are used for accessing external data sources. Using the FDW-based sharding, the data is partitioned to the shards in order to optimize the query for the sharded table. Various parts of the query e.g., aggregates, joins, are pushed down to the shards. This enables the heavy query processing to be done on the shards and only results of the query are sent back to the primary node.

使用 FDW 架构肯定会增加一些开销,而其他更复杂的跨节点通信技术可以避免这些开销。 FDW 分片的权衡是它使用的是可信架构,与其他方法相比,实现起来更简单且耗时相对更少

Using the FDW architecture surely adds some overhead which can be avoided by other more sophisticated cross-node communication techniques. The trade-off with FDW sharding is that it is using a trusted architecture and it is simpler and relatively less time consuming to implements compared to other methods

上图解释了 PostgreSQL 中内置分片的当前方法。 分区是在外部服务器上创建的,PostgreSQL FDW 用于访问外部服务器并使用分区修剪逻辑,规划器决定访问哪个分区以及从搜索中排除哪些分区。

The diagram above explains the current approach of built-in Sharding in PostgreSQL. The partitions are created on foreign servers and PostgreSQL FDW is used for accessing the foreign servers and using the partition pruning logic the planner decides which partition to access and which partitions to exclude from the search.

Existing PostgreSQL forks for Sharding

有十几个 Postgres 分支实现了分片。尽管其中许多分叉已经成功,但它们往往落后于 Postgres 的社区发布。通过在社区 Postgres 中实现分片,此功能将可供所有用户在当前版本的 Postgres 中使用。这将大大增加社区 Postgres 在需要高写入扩展性或拥有非常大数据库的环境中的采用。 There are over a dozen forks of Postgres which implement sharding. While many of these forks have been successful, they often lag behind the community release of Postgres. By implementing sharding in community Postgres, this feature will be available to all users in current releases of Postgres. This should greatly increase the adoption of community Postgres in environments that need high write scaling or have very large databases. 在 Postgres 中实现分片的一大挑战是以最少的代码更改来实现这一目标。 Postgres 的大多数分片分支都需要对社区代码进行大量更改,这对于一般 Postgres 社区来说是不可接受的,其中许多人不需要分片。随着外部数据包装器 (FDW) 的出现,现在可以考虑内置分片实现,该实现可以通过可接受的代码更改级别来完成。 One great challenge to implementing sharding in Postgres is achieving this goal with minimal code changes. Most of the sharding forks of Postgres require a volume of changes to the community code that would be unacceptable to the general Postgres community, many of whom don’t need sharding. With the advent of Foreign Data Wrappers (FDW), it is now possible to consider a built-in sharding implementation which could be accomplished with an acceptable level of code changes. 这种可能的基于 FDW 的分片解决方案的基本设计是基于 NTT 开发了近十年的 Postgres-XC 所做的工作。 Postgres-XL 是这种设计的更灵活的实现。 Citus 融合了这两个项目的想法,并提供了分片,而无需从 Postgres 分叉。 The basic design of this possible FDW-based sharding solution is based on the work done by Postgres-XC, which was developed by NTT for almost ten years. Postgres-XL is a more flexible implementation of this design. Citus incorporates ideas from both projects and provides sharding without forking from Postgres.

FDW Based Enhancements

需要增强 FDW 机制以支持分片架构。这将使大量查询处理能够在外部服务器端完成,并且只有过滤的结果将被发送回父节点。下推功能将使分片(即外部服务器)能够完成繁重的工作,从而大大提高了此功能的性能。在这种情况下,下推是将部分查询推送到外部服务器的能力,以减少从外部服务器到父节点的数据量。从一开始就属于 postgres FDW 的两种基本下推技术是选择目标列表下推和 WHERE 子句下推。

The FDW machinery needs to be enhanced in order to support the sharding architecture. This will enable the bulk of query processing to be done on the foreign server side and only the filtered results will be sent back to the parent node. The push down capabilities will enable the shards (i.e. foreign servers) to do the heavy lifting, which greatly improves the performance of this feature. Push down in this context is the ability to push parts of the query to foreign servers in order to decrease the amount of data traveling from the foreign server to parent node. The two basic push-down techniques that have been part of postgres FDW from the start are select target-list pushdown and WHERE clause pushdown.

在上面的查询中,规划器将根据分区键(在这种情况下为 logdate)决定访问哪个分区。 WHERE 子句将被推送到包含相应分区的外部服务器。这是 postgres_fdw 中可用的基本下推功能。

In the query above the planner will decide which partition to access based on the partition key i.e. logdate in this case. The WHERE clause will be pushed down to the foreign server that contains the respective partition. That’s the basic push down capabilities available in postgres_fdw.

分片功能需要更高级的下推功能,以便将最大操作下推到包含分区的外部服务器,并最小化通过线路发送到父节点的数据。

The sharding feature requires more advanced push-down capabilities in order to push the maximum operations down to the foreign servers containing partitions and minimizing the data sent over the wire to the parent node.

以上是在最近几个主要版本中添加到 PostgreSQL 的一组下推功能。 这些功能的好处是,即使没有完整的分片功能,它也已经使许多用例受益。需要注意的是,即使没有完整的分片功能,这些 FDW 增强功能对于 FDW 查询的性能也非常有用。

The above is the set of push down capabilities that have been added to PostgreSQL in last few major releases. The good thing about these features is that it already benefits a number of use cases even when the entire sharding feature is not in place. It is important to note that these FDW enhancements are very useful for the performance of FDW queries even in the absence of the complete sharding feature.

Partitioning Enhancements

Missing pieces for MVP of Sharding

在我们可以说我们在 PostgreSQL 中具有分片功能之前,还有一些重要的功能仍然存在。 在本节中,我们将讨论这些功能以及这些功能面临的挑战。 我确信还有其他与数据库集群管理相关的功能,即备份/故障转移、监控,不在此列表中。The are still a number of important features remaining before we can say that we have a sharding feature in PostgreSQL. In this section we are going to discuss these features and the challenges with these features. I am sure there are other features related to database cluster management i.e., backup/failover, monitoring, that are not in this list.

2PC for foreign data wrapper transactions 目前 FDW 事务不支持两阶段提交。 这意味着如果您在事务中使用多个外部服务器,并且如果事务的一部分在一个外部服务器中失败,那么所有外部服务器上的整个事务都将失败。 需要此功能以保证跨数据库集群的数据一致性,并且需要支持 OLTP 工作负载; 因此它对于分片功能非常重要。过去几年,该功能的设计方案和补丁已发送给黑客,但没有引起足够的社区兴趣; 所以这个功能的设计还是很出众的。

Parallel foreign scan 当一个查询在单个查询中查询多个外部扫描时,所有外部扫描都按顺序执行,一个接一个。并行外部扫描功能将允许并行执行多个外部扫描。此功能对于 OLAP 用例很重要。例如,如果您在一个被划分为大量分区的大型分区表上运行 AVG 查询,则 AVG 操作将按顺序发送到每个外部服务器,并将每个外部服务器的结果发送到父节点。父节点将聚合并发送回客户端。一旦我们拥有并行外部扫描功能,所有平均操作将在所有外部服务器上并行执行,并将结果发送到父节点。父节点将聚合数据并将结果发送给客户端。这是完成分片功能所需的关键部分。我们目前有聚合下推,将聚合发送到外部服务器,但我们没有在所有分区上并行运行聚合操作的功能。此功能对于 OLAP 用例尤为重要。让大量外部服务器包含用于大型分区表的分区以及在所有外部服务器上并行运行的聚合操作的想法非常强大。并行外部扫描功能的基础设施是异步查询执行;这是 PostgreSQL 的一个重大变化。

Global Snapshot Manager 这是分片所必需的另一个非常重要且困难的功能。全局快照管理器的目的是提供全局事务一致性。假设您有两个使用分片表的并发客户端,客户端 #1 尝试访问服务器 1 上的分区,客户端 #2 也尝试访问服务器 1 上的分区。客户端 2 应该获得一致的视图即,在客户端 1 的事务期间对分区所做的任何更改(例如,更新)都不应该对客户端 2 可见。一旦客户端 1 的事务被提交,费用将对所有新事务可见。假设全局快照管理器确保所有事务获得数据库集群的一致视图。所有使用数据库集群的并发客户端(表在多个外部服务器上分片)应该看到数据库集群的一致视图。这是一个很难解决的问题,像 Postgres Professional 这样的公司已经尝试通过使用外部事务管理器来解决这个问题。 提到使用其他方法,如 Clock-SI(分区表的快照隔离)方法,随后其他成功的项目(如 Google cloud spanner 和 YugaByte)用于解决相同的问题

Bulk DML operations 具有外部分区的分区表的 INSERT / UPDATE / DELETE / COPY 操作必须支持多个插入操作。 对于单个或局部划分的关系,这对于加速批量操作是必要的。

ToDo List

以下是社区中 Sharding 的活动功能列表及其更新状态:

postgres_fdw 节点上的异步追加(​​并行外部扫描​​)Asynchronous Append on postgres_fdw nodes (parallel foreign scans) 状态:这个补丁最初是由Horiguchi-san创作的。 最近审查和基准测试由 HighGo 的 Movead 完成。下一步:Fujita-san 目前正在审查这个 PG 14 的补丁全局事务管理器(​​FDW 事务的两阶段提交​​)Global transaction manager (two phase commit for FDW transactions) 状态:此补丁最初由 Masahiko Sawada 和 Ashutosh Bapat 创作。 Swada 和 Muhammad Usama 最近一直在社区做这方面的工作。 在 Swada 和 Usama 合作之后,这个线程现在有很好的活动。 Amit Kaplia 最近附和了他的评论。 下一步:Swada 和 Usama 将跟进一些更新,需要高级提交者来审查这个补丁。基于 CSN 的快照(​​全局快照需要的​​)CSN based snapshots (required for global snapshots)状态:这个补丁最初是由 Postgres Professional 编写的。 最近,来自 HighGo 的 Movead 对补丁进行了重新调整,并提供了一个增强的补丁,其中包含 WAL 支持、性能改进和杂项错误修复。 我们需要社区的资深人士来审核这个补丁,这是在 PostgreSQL 中添加全局快照管理器的基础。下一步:我们需要社区的资深人士来审核这个补丁,这是在 PostgreSQL 中添加全局快照管理器的基础。批量 DML 操作 - 具有外部分区的分区表的 INSERT/UPDATE/DELETE/COPY 操作需要支持多插入操作。 对于单个或本地分区关系,需要加速批量操作。Bulk DML operations- INSERT/UPDATE/DELETE/COPY operations for a partitioned table with foreign partitions needs to support multi insert operations. It is needed to speedup bulk operations as for single or locally partitioned relation.​​批量 DML 操作​​ 状态:这些补丁最初由 Tomas Vondra 和 Andrey Lepikhov 分别创作。 它们都显示了对外部表和具有外部分区的分区表的批量插入的显着加速。 第一个补丁正在开发中。 Ashutosh Bapat 和 Etsuro Fujita 正在审查第二个补丁。下一步:我们需要社区中的资深人士来审查这些补丁。具有时钟 SI 集成的全局快照管理器(Global snapshot manager with clock SI integration) 状态:HighGo 的 Usama 和 Movead 正在制定设计方案和开发计划,将在适当的时候与该小组分享。分片管理。 (在分片上自动创建分区)Shard management. (Auto creation of partitions on shards) 状态:社区中没有人积极致力于此FDW 增强功能(FDW Enhancements) 待定(需要定义对分片功能很重要的剩余 FDW 增强功能) 状态:目前没有人在社区中从事此工作。

Use Cases

有四种可能的用例需求不断增加:(There are four possible use cases with increasing requirements:)

使用聚合查询对只读分片进行跨节点只读查询,例如 数据仓库:这是最简单的实现,因为它不需要全局事务管理器、全局快照管理器,并且由于聚合,从分片返回的行数是最小的。Cross-node read-only queries on read-only shards using aggregate queries, e.g. data warehouse:This is the simplest to implement as it doesn’t require a global transaction manager, global snapshot manager, and the number of rows returned from the shards is minimal because of the aggregates.使用非聚合查询对只读分片进行跨节点只读查询:这将迫使协调器收集和处理许多返回的行,并将显示 FDW 传输机制的可扩展性。Cross-node read-only queries on read-only shards using non-aggregate queries: This will stress the coordinator to collect and process many returned rows, and will show how well the FDW transfer mechanism scales.读/写分片上的跨节点只读查询:这将需要一个全局快照管理器来确保分片返回一致的数据。Cross-node read-only queries on read/write shards: This will require a global snapshot manager to make sure the shards return consistent data.跨节点读写查询:这将需要一个全局快照管理器和全局事务管理器。Cross-node read-write queries: This will require a global snapshot manager and global transaction manager.

​​https://wiki.postgresql.org/wiki/WIP_PostgreSQL_Sharding#Companies​​

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Barman备份恢复迁移——Introduction
下一篇:PostgreSQL数据库复制——walsender后端启动
相关文章

 发表评论

暂时没有评论,来抢沙发吧~