支持的版本:当前 (17) / 16 / 15 / 14 / 13
开发版本:devel
不支持的版本:12 / 11 / 10 / 9.6 / 9.5 / 9.4 / 9.3 / 9.2 / 9.1

19.6. 复制 #

这些设置控制内置的流复制功能(请参阅第 26.2.5 节)和内置的逻辑复制功能(请参阅第 29 章)的行为。

对于流复制,服务器将是主服务器或备用服务器。主服务器可以发送数据,而备用服务器始终是复制数据的接收者。当使用级联复制(请参阅第 26.2.7 节)时,备用服务器也可以是发送者,以及接收者。参数主要用于发送和备用服务器,尽管某些参数仅在主服务器上有意义。如果需要,群集中的设置可能会有所不同,而不会出现问题。

对于逻辑复制发布者(执行 CREATE PUBLICATION 的服务器)将数据复制到订阅者(执行 CREATE SUBSCRIPTION 的服务器)。服务器也可以同时是发布者和订阅者。请注意,以下各节将发布者称为“发送者”。有关逻辑复制配置设置的更多详细信息,请参阅第 29.11 节

19.6.1. 发送服务器 #

这些参数可以在任何要将复制数据发送到一个或多个备用服务器的服务器上设置。主服务器始终是发送服务器,因此这些参数必须始终在主服务器上设置。这些参数的角色和含义在备用服务器成为主服务器后不会改变。

max_wal_senders (integer) #

指定来自备用服务器或流式基本备份客户端的并发连接的最大数量(即同时运行的 WAL 发送器进程的最大数量)。默认值为 100 值表示禁用复制。流客户端的突然断开可能会留下一个孤立的连接槽,直到达到超时,因此此参数应设置为略高于预期客户端的最大数量,以便断开连接的客户端可以立即重新连接。此参数只能在服务器启动时设置。此外,必须将 wal_level 设置为 replica 或更高,以允许来自备用服务器的连接。

在运行备用服务器时,您必须将此参数设置为与主服务器相同或更高的值。否则,将不允许在备用服务器中执行查询。

max_replication_slots (integer) #

指定服务器可以支持的最大复制槽数(请参阅第 26.2.6 节)。默认值为 10。此参数只能在服务器启动时设置。将其设置为低于当前存在的复制槽数的较低值将阻止服务器启动。此外,必须将 wal_level 设置为 replica 或更高,以允许使用复制槽。

请注意,此参数也适用于订阅者端,但具有不同的含义。

wal_keep_size (integer) #

指定保留在 pg_wal 目录中的过去 WAL 文件的最小大小,以防备用服务器需要获取它们以进行流复制。如果连接到发送服务器的备用服务器落后于 wal_keep_size 兆字节以上,则发送服务器可能会删除备用服务器仍然需要的 WAL 段,在这种情况下,复制连接将终止。下游连接最终也会因此失败。(但是,如果正在使用 WAL 归档,则备用服务器可以通过从归档中获取段来恢复。)

这仅设置保留在 pg_wal 中的段的最小大小;系统可能需要保留更多段以进行 WAL 归档或从检查点恢复。如果 wal_keep_size 为零(默认值),则系统不会为备用目的保留任何额外的段,因此可供备用服务器使用的旧 WAL 段的数量是先前检查点的位置和 WAL 归档状态的函数。如果此值在没有单位的情况下指定,则将其视为兆字节。此参数只能在 postgresql.conf 文件中或在服务器命令行中设置。

max_slot_wal_keep_size (integer) #

指定复制槽在检查点时允许保留在 pg_wal 目录中的 WAL 文件的最大大小。如果 max_slot_wal_keep_size 为 -1(默认值),则复制槽可以保留无限数量的 WAL 文件。否则,如果复制槽的 restart_lsn 落后于当前 LSN 超过给定大小,则由于删除了所需的 WAL 文件,使用该槽的备用服务器可能无法继续复制。您可以在pg_replication_slots中查看复制槽的 WAL 可用性。如果此值在没有单位的情况下指定,则将其视为兆字节。此参数只能在 postgresql.conf 文件中或在服务器命令行中设置。

wal_sender_timeout (integer) #

终止不活动时间超过此值的复制连接。这对于发送服务器检测备用服务器崩溃或网络中断很有用。如果此值在没有单位的情况下指定,则将其视为毫秒。默认值为 60 秒。值为零表示禁用超时机制。

对于跨多个地理位置分布的群集,在每个位置使用不同的值可以为群集管理带来更大的灵活性。较小的值有助于通过具有低延迟网络连接的备用服务器更快地检测故障,而较大的值有助于在备用服务器位于远程位置且具有高延迟网络连接的情况下更好地判断备用服务器的运行状况。

track_commit_timestamp (boolean) #

记录事务的提交时间。此参数只能在 postgresql.conf 文件中或在服务器命令行中设置。默认值为 off

synchronized_standby_slots (string) #

以逗号分隔的逻辑 WAL 发送器进程将等待的流复制备用服务器槽名称列表。仅当指定的复制槽确认接收到 WAL 时,逻辑 WAL 发送器进程才会将解码的更改发送到插件。这保证了逻辑复制故障转移槽不会消耗更改,直到这些更改被接收并刷新到相应的物理备用服务器。如果逻辑复制连接打算在备用服务器升级后切换到物理备用服务器,则应在此处列出备用服务器的物理复制槽。请注意,如果 synchronized_standby_slots 中指定的槽不存在或无效,则逻辑复制将不会继续。此外,当与逻辑故障转移槽一起使用时,复制管理函数pg_replication_slot_advancepg_logical_slot_get_changespg_logical_slot_peek_changes将阻止,直到 synchronized_standby_slots 中指定的所有物理槽都确认收到 WAL。

synchronized_standby_slots 中物理复制槽对应的备用服务器必须配置 sync_replication_slots = true,以便它们可以从主服务器接收逻辑故障转移槽更改。

19.6.2. 主服务器 #

这些参数可以在主服务器上设置,该主服务器将复制数据发送到一个或多个备用服务器。请注意,除了这些参数之外,还必须在主服务器上正确设置 wal_level,并且可以选择启用 WAL 归档(请参阅第 19.5.3 节)。这些参数在备用服务器上的值无关紧要,尽管您可能希望在那里设置它们,以便为备用服务器成为主服务器的可能性做好准备。

synchronous_standby_names (string) #

指定可以支持同步复制的备用服务器列表,如第 26.2.8 节所述。将有一个或多个活动的同步备用服务器;在这些备用服务器确认收到其数据后,等待提交的事务将被允许继续执行。同步备用服务器将是那些名称出现在此列表中的,并且当前已连接并实时流式传输数据的(如 pg_stat_replication 视图中的 streaming 状态所示)。指定多个同步备用服务器可以实现非常高的可用性并防止数据丢失。

为此目的的备用服务器名称是备用服务器的 application_name 设置,如备用服务器的连接信息中所设置。在物理复制备用服务器的情况下,应该在 primary_conninfo 设置中设置;如果设置了 cluster_name,则默认为该设置,否则默认为 walreceiver。对于逻辑复制,可以在订阅的连接信息中设置,默认为订阅名称。对于其他复制流消费者,请查阅其文档。

此参数使用以下任一语法指定备用服务器列表

[FIRST] num_sync ( standby_name [, ...] )
ANY num_sync ( standby_name [, ...] )
standby_name [, ...]

其中 num_sync 是事务需要等待回复的同步备用服务器的数量,standby_name 是备用服务器的名称。FIRSTANY 指定从列出的服务器中选择同步备用服务器的方法。

关键字 FIRSTnum_sync 结合使用,指定基于优先级的同步复制,并使事务提交等待,直到它们的 WAL 记录被复制到基于其优先级选择的 num_sync 个同步备用服务器。例如,设置 FIRST 3 (s1, s2, s3, s4) 将导致每次提交等待从备用服务器 s1s2s3s4 中选择的三个优先级较高的备用服务器的回复。列表中较早出现的备用服务器具有较高的优先级,将被视为同步的。此列表中稍后出现的其他备用服务器代表潜在的同步备用服务器。如果任何当前的同步备用服务器由于任何原因断开连接,它将立即被下一个优先级最高的备用服务器替换。关键字 FIRST 是可选的。

关键字 ANYnum_sync 结合使用,指定基于仲裁的同步复制,并使事务提交等待,直到它们的 WAL 记录被复制到 至少 num_sync 个列出的备用服务器。例如,设置 ANY 3 (s1, s2, s3, s4) 将导致每次提交在 s1s2s3s4 中至少有三个备用服务器回复后立即继续。

FIRSTANY 不区分大小写。如果这些关键字用作备用服务器的名称,则其 standby_name 必须用双引号引起来。

第三种语法在 PostgreSQL 9.6 版本之前使用,并且仍然受支持。它与第一种语法相同,其中 FIRSTnum_sync 等于 1。例如,FIRST 1 (s1, s2)s1, s2 具有相同的含义:选择 s1s2 作为同步备用服务器。

特殊条目 * 匹配任何备用服务器名称。

没有机制来强制备用服务器名称的唯一性。如果存在重复项,则其中一个匹配的备用服务器将被视为具有更高的优先级,但具体是哪一个是不确定的。

注意

每个 standby_name 都应具有有效的 SQL 标识符的形式,除非它是 *。如果需要,可以使用双引号。但请注意,无论是否使用双引号,standby_name 都会与备用应用程序名称进行不区分大小写的比较。

如果此处未指定同步备用服务器名称,则不会启用同步复制,并且事务提交将不会等待复制。这是默认配置。即使启用了同步复制,也可以通过将 synchronous_commit 参数设置为 localoff,将单个事务配置为不等待复制。

此参数只能在 postgresql.conf 文件中或服务器命令行上设置。

19.6.3. 备用服务器 #

这些设置控制接收复制数据的备用服务器的行为。它们在主服务器上的值无关紧要。

primary_conninfo (string) #

指定备用服务器用于连接发送服务器的连接字符串。此字符串的格式如第 32.1.1 节中所述。如果此字符串中未指定任何选项,则会检查相应的环境变量(请参阅第 32.15 节)。如果也没有设置环境变量,则使用默认值。

连接字符串应指定发送服务器的主机名(或地址),以及端口号(如果它与备用服务器的默认端口号不同)。还要指定与发送服务器上具有适当权限的角色对应的用户名(请参阅第 26.2.5.1 节)。如果发送者需要密码身份验证,则还需要提供密码。它可以在 primary_conninfo 字符串中提供,也可以在备用服务器上的单独 ~/.pgpass 文件中提供(使用 replication 作为数据库名称)。

对于复制槽同步(请参阅第 47.2.3 节),还需要在 primary_conninfo 字符串中指定有效的 dbname。这仅用于槽同步。它被忽略用于流式传输。

此参数只能在 postgresql.conf 文件中或服务器命令行上设置。如果在 WAL 接收器进程运行时更改此参数,则会向该进程发出信号以关闭,并期望使用新设置重新启动(除非 primary_conninfo 是空字符串)。如果服务器未处于备用模式,则此设置无效。

primary_slot_name (string) #

可以选择指定一个现有的复制槽,以便在使用流式复制连接到发送服务器时使用,以控制上游节点上的资源删除(请参阅第 26.2.6 节)。此参数只能在 postgresql.conf 文件中或服务器命令行上设置。如果在 WAL 接收器进程运行时更改此参数,则会向该进程发出信号以关闭,并期望使用新设置重新启动。如果未设置 primary_conninfo 或服务器未处于备用模式,则此设置无效。

hot_standby (boolean) #

指定是否可以在恢复期间连接并运行查询,如第 26.4 节中所述。默认值为 on。此参数只能在服务器启动时设置。它仅在归档恢复或备用模式下有效。

max_standby_archive_delay (integer) #

当热备用处于活动状态时,此参数确定备用服务器在取消与即将应用的 WAL 条目冲突的备用查询之前应等待多长时间,如第 26.4.2 节中所述。max_standby_archive_delay 在从 WAL 归档读取 WAL 数据时应用(因此不是最新的)。如果此值在未指定单位的情况下指定,则将其视为毫秒。默认值为 30 秒。值为 -1 允许备用服务器无限期地等待冲突的查询完成。此参数只能在 postgresql.conf 文件中或服务器命令行上设置。

请注意,max_standby_archive_delay 与查询在取消之前可以运行的最长时间不同;相反,它是允许应用任何一个 WAL 段数据的最大总时间。因此,如果一个查询在 WAL 段的早期导致了明显的延迟,则后续冲突的查询的宽限时间将大大缩短。

max_standby_streaming_delay (integer) #

当热备用处于活动状态时,此参数确定备用服务器在取消与即将应用的 WAL 条目冲突的备用查询之前应等待多长时间,如第 26.4.2 节中所述。max_standby_streaming_delay 在通过流式复制接收 WAL 数据时应用。如果此值在未指定单位的情况下指定,则将其视为毫秒。默认值为 30 秒。值为 -1 允许备用服务器无限期地等待冲突的查询完成。此参数只能在 postgresql.conf 文件中或服务器命令行上设置。

请注意,max_standby_streaming_delay 与查询在被取消前可以运行的最大时长不同;它指的是在从主服务器接收到 WAL 数据后,允许应用这些数据的最大总时间。因此,如果一个查询导致了明显的延迟,那么后续冲突的查询将只有更少的缓冲时间,直到备用服务器再次赶上进度。

wal_receiver_create_temp_slot (boolean) #

指定当没有配置要使用的永久复制槽(使用 primary_slot_name)时,WAL 接收器进程是否应在远程实例上创建临时的复制槽。默认值为关闭。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。如果在 WAL 接收器进程运行时更改此参数,则该进程会被信号通知关闭,并期望使用新的设置重新启动。

wal_receiver_status_interval (integer) #

指定备用服务器上的 WAL 接收器进程向主服务器或上游备用服务器发送有关复制进度的信息的最小频率,这些信息可以使用 pg_stat_replication 视图查看。备用服务器将报告它已写入的最后一个预写式日志位置、它已刷新到磁盘的最后一个位置以及它已应用的最后一个位置。此参数的值是报告之间的最大时间间隔。每次写入或刷新位置更改时都会发送更新,或者如果设置为非零值,则会按照此参数指定的频率发送更新。在忽略此参数的情况下还会发送更新的其他情况;例如,当现有 WAL 的处理完成时或当 synchronous_commit 设置为 remote_apply 时。因此,应用位置可能会稍微滞后于真实位置。如果此值在没有单位的情况下指定,则将其视为秒。默认值为 10 秒。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

hot_standby_feedback (boolean) #

指定热备用是否会向主服务器或上游备用服务器发送有关当前在备用服务器上执行的查询的反馈。此参数可用于消除由清理记录引起的查询取消,但可能会导致主服务器上某些工作负载的数据库膨胀。反馈消息的发送频率不会高于每 wal_receiver_status_interval 一次。默认值为 off。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

如果使用级联复制,则反馈会向上游传递,直到最终到达主服务器。备用服务器除了向上游传递之外,不会对接收到的反馈进行任何其他使用。

wal_receiver_timeout (integer) #

终止超过此时间长度不活动的复制连接。这对于接收备用服务器检测主节点崩溃或网络中断很有用。如果此值在没有单位的情况下指定,则将其视为毫秒。默认值为 60 秒。值为零将禁用超时机制。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

wal_retrieve_retry_interval (integer) #

指定当从任何来源(流式复制、本地 pg_wal 或 WAL 归档)都无法获得 WAL 数据时,备用服务器应等待多长时间,然后再尝试再次检索 WAL 数据。如果此值在没有单位的情况下指定,则将其视为毫秒。默认值为 5 秒。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

此参数在恢复中的节点需要控制等待新 WAL 数据可用的时间长度的配置中很有用。例如,在归档恢复中,可以通过减小此参数的值来使恢复在检测新 WAL 文件时更具响应性。在 WAL 活动较低的系统上,增加此参数的值可以减少访问 WAL 归档所需的请求量,这在云环境中很有用,因为在云环境中会考虑访问基础设施的次数。

在逻辑复制中,此参数还会限制失败的复制应用工作进程的重新启动频率。

recovery_min_apply_delay (integer) #

默认情况下,备用服务器会尽快从发送服务器还原 WAL 记录。拥有数据的延迟副本可能很有用,这提供了纠正数据丢失错误的机会。此参数允许您将恢复延迟指定的时间量。例如,如果将此参数设置为 5min,则仅当备用服务器上的系统时间至少比主服务器报告的提交时间晚五分钟时,备用服务器才会重播每个事务提交。如果此值在没有单位的情况下指定,则将其视为毫秒。默认值为零,不添加延迟。

服务器之间的复制延迟可能超过此参数的值,在这种情况下,不会添加任何延迟。请注意,延迟是在主服务器上写入的 WAL 时间戳和备用服务器上的当前时间之间计算的。由于网络延迟或级联复制配置导致的传输延迟可能会大大减少实际等待时间。如果主服务器和备用服务器上的系统时钟未同步,则可能导致恢复比预期更早地应用记录;但这并不是一个主要问题,因为此参数的有用设置远大于服务器之间的典型时间偏差。

延迟仅在事务提交的 WAL 记录上发生。其他记录会尽快重播,这不是问题,因为 MVCC 可见性规则确保它们的更改效果在应用相应的提交记录之前是不可见的。

延迟仅在恢复中的数据库达到一致状态之后发生,直到备用服务器被提升或触发。之后,备用服务器将结束恢复,而不再等待。

WAL 记录必须保留在备用服务器上,直到它们准备好被应用为止。因此,较长的延迟将导致 WAL 文件积累更多,从而增加备用服务器 pg_wal 目录的磁盘空间要求。

此参数旨在用于流式复制部署;但是,如果指定了该参数,则在除崩溃恢复之外的所有情况下都会遵守该参数。hot_standby_feedback 将因使用此功能而延迟,这可能会导致主服务器上的膨胀;请谨慎地一起使用这两者。

警告

synchronous_commit 设置为 remote_apply 时,同步复制会受到此设置的影响;每个 COMMIT 都需要等待应用。

此参数只能在 postgresql.conf 文件中或服务器命令行上设置。

sync_replication_slots (boolean) #

它使物理备用服务器能够同步来自主服务器的逻辑故障转移槽,以便逻辑订阅者可以在故障转移后从新的主服务器恢复复制。

默认情况下禁用此选项。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

19.6.4. 订阅者 #

这些设置控制逻辑复制订阅者的行为。它们在发布者上的值是无关紧要的。有关详细信息,请参阅 第 29.11 节

max_replication_slots (integer) #

指定可以同时跟踪多少个复制源(请参阅 第 48 章),有效地限制了可以在服务器上创建多少个逻辑复制订阅。将其设置为低于当前跟踪的复制源数量(反映在 pg_replication_origin_status 中)的值将阻止服务器启动。max_replication_slots 必须至少设置为将添加到订阅者的订阅数,再加上一些用于表同步的保留量。

请注意,此参数也适用于发送服务器,但具有不同的含义。

max_logical_replication_workers (integer) #

指定逻辑复制工作进程的最大数量。这包括领导应用工作进程、并行应用工作进程和表同步工作进程。

逻辑复制工作进程取自 max_worker_processes 定义的池。

默认值为 4。此参数只能在服务器启动时设置。

max_sync_workers_per_subscription (integer) #

每个订阅的最大同步工作进程数。此参数控制订阅初始化期间或添加新表时初始数据复制的并行量。

目前,每个表只能有一个同步工作进程。

同步工作进程取自 max_logical_replication_workers 定义的池。

默认值为 2。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

max_parallel_apply_workers_per_subscription (integer) #

每个订阅的最大并行应用工作进程数。 此参数控制使用订阅参数 streaming = parallel 进行中的事务流的并行度。

并行应用工作进程取自 max_logical_replication_workers 定义的池。

默认值为 2。此参数只能在 postgresql.conf 文件中或在服务器命令行上设置。

提交更正

如果您发现文档中任何不正确的内容,与您使用特定功能的体验不符或需要进一步澄清的内容,请使用此表单来报告文档问题。