amcostestimate
函数会收到描述可能索引扫描的信息,包括已确定可用于该索引的 WHERE 和 ORDER BY 子句列表。它必须返回访问索引的成本估算以及 WHERE 子句的选择性(即在索引扫描期间将检索的父表行数比例)。对于简单的情况,成本估算器的大部分工作可以通过调用优化器中的标准例程来完成;拥有 amcostestimate
函数的意义在于允许索引访问方法提供特定于索引类型的知识,以防可以改进标准估算。
每个 amcostestimate
函数必须具有以下签名:
void amcostestimate (PlannerInfo *root, IndexPath *path, double loop_count, Cost *indexStartupCost, Cost *indexTotalCost, Selectivity *indexSelectivity, double *indexCorrelation, double *indexPages);
前三个参数是输入:
root
规划器关于正在处理的查询的信息。
path
正在考虑的索引访问路径。除了成本和选择性值之外,所有字段都有效。
loop_count
应计入成本估算的索引扫描重复次数。当考虑用于嵌套循环连接内部的参数化扫描时,这通常大于 1。请注意,成本估算仍然应该只针对一次扫描;较大的loop_count
意味着可能适合考虑跨多次扫描的某些缓存效果。
最后五个参数是通过引用传递的输出:
*indexStartupCost
设置为索引启动处理的成本
*indexTotalCost
设置为索引处理的总成本
*indexSelectivity
设置为索引选择性
*indexCorrelation
设置为索引扫描顺序与基础表顺序之间的相关系数
*indexPages
设置为索引叶子页数
请注意,成本估算函数必须使用 C 语言编写,而不是使用 SQL 或任何可用的过程语言,因为它们必须访问规划器/优化器的内部数据结构。
索引访问成本应使用 src/backend/optimizer/path/costsize.c
使用的参数计算:顺序磁盘块获取的成本为 seq_page_cost
,非顺序获取的成本为 random_page_cost
,处理一个索引行的成本通常应视为 cpu_index_tuple_cost
。此外,对于索引处理期间调用的任何比较运算符(尤其是索引限定条件本身的评估),应收取适当的 cpu_operator_cost
倍数。
访问成本应包括与扫描索引本身相关的所有磁盘和 CPU 成本,但 不 包括检索或处理由索引标识的父表行的成本。
“启动成本” 是总扫描成本的一部分,必须在开始获取第一行之前支出。对于大多数索引,这可以视为零,但启动成本较高的索引类型可能需要将其设置为非零。
indexSelectivity
应设置为在索引扫描期间将检索的父表行的估计比例。在有损查询的情况下,这通常会高于实际通过给定限定条件行的比例。
indexCorrelation
应设置为索引顺序与表顺序之间的相关性(范围在 -1.0 到 1.0 之间)。这用于调整从父表获取行的成本估算。
indexPages
应设置为叶子页数。这用于估计并行索引扫描的工作进程数。
当 loop_count
大于 1 时,返回的数字应为索引任何一次扫描的预期平均值。
成本估算
典型的成本估算器将按如下步骤进行:
根据给定的限定条件,估算并返回将访问的父表行比例。在没有任何特定于索引类型的知识的情况下,使用标准优化器函数 clauselist_selectivity()
*indexSelectivity = clauselist_selectivity(root, path->indexquals, path->indexinfo->rel->relid, JOIN_INNER, NULL);
估算扫描期间将访问的索引行数。对于许多索引类型,这与 indexSelectivity
乘以索引中的行数相同,但可能会更多。(请注意,索引在页面和行中的大小可从 path->indexinfo
结构中获得。)
估算扫描期间将检索的索引页数。这可能只是 indexSelectivity
乘以索引在页面中的大小。
计算索引访问成本。通用估算器可能会这样做:
/* * Our generic assumption is that the index pages will be read * sequentially, so they cost seq_page_cost each, not random_page_cost. * Also, we charge for evaluation of the indexquals at each index row. * All the costs are assumed to be paid incrementally during the scan. */ cost_qual_eval(&index_qual_cost, path->indexquals, root); *indexStartupCost = index_qual_cost.startup; *indexTotalCost = seq_page_cost * numIndexPages + (cpu_index_tuple_cost + index_qual_cost.per_tuple) * numIndexTuples;
但是,以上并未考虑跨重复索引扫描的索引读取摊销。
估算索引相关性。对于单个字段上的简单有序索引,可以从 pg_statistic 中检索到。如果相关性未知,则保守的估算为零(不相关)。
成本估算器函数的示例可以在 src/backend/utils/adt/selfuncs.c
中找到。
如果您发现文档中的任何内容不正确、与特定功能的使用体验不符或需要进一步澄清,请使用此表单报告文档问题。