受支持版本: 当前版本 (18) / 17 / 16 / 15 / 14
开发版本: devel

2.7. 聚合函数 #

与大多数其他关系数据库产品一样,PostgreSQL支持 聚合函数。聚合函数从多行输入中计算出单个结果。 例如,有一些聚合函数可在一组行上计算count(计数)、 sum(和)、avg(平均值)、 max(最大值)和min(最小值)。

例如,我们可以用下面的语句找出所有记录中最低温度读数的最高值:

SELECT max(temp_lo) FROM weather;
 max
-----
  46
(1 row)

如果我们想知道该读数出现在哪个城市(或哪些城市),可能会尝试:

SELECT city FROM weather WHERE temp_lo = max(temp_lo);     -- WRONG

但这样行不通,因为聚合函数max不能用于 WHERE子句中(存在这个限制是因为WHERE 子句决定哪些行会被纳入聚合计算;因此显然它必须在聚合函数计算之前求值。) 不过,这类情况下通常可以把查询改写成能够得到所需结果的形式,这里我们通过使用 子查询来做到这一点:

SELECT city FROM weather
    WHERE temp_lo = (SELECT max(temp_lo) FROM weather);
     city
---------------
 San Francisco
(1 row)

这样做是可以的,因为子查询是一次独立的计算,它会与外层查询分开计算自己的聚合。

聚合与GROUP BY子句结合使用时也非常有用。例如,我们可以得到 每个城市的读数个数,以及该城市观测到的最低温度中的最高值:

SELECT city, count(*), max(temp_lo)
    FROM weather
    GROUP BY city;
     city      | count | max
---------------+-------+-----
 Hayward       |     1 |  37
 San Francisco |     2 |  46
(2 rows)

这样每个城市都会得到一行输出。每个聚合结果都是在与该城市匹配的表行上计算出来的。 我们可以使用HAVING来过滤这些分组行:

SELECT city, count(*), max(temp_lo)
    FROM weather
    GROUP BY city
    HAVING max(temp_lo) < 40;
  city   | count | max
---------+-------+-----
 Hayward |     1 |  37
(1 row)

这样只会得到所有temp_lo值都低于 40 的城市的结果。 最后,如果我们只关心名称以S开头的城市, 可以这样做:

SELECT city, count(*), max(temp_lo)
    FROM weather
    WHERE city LIKE 'S%'            -- (1)
    GROUP BY city;
     city      | count | max
---------------+-------+-----
 San Francisco |     2 |  46
(1 row)

(1)

LIKE操作符执行模式匹配,详细说明见 Section 9.7

理解聚合与SQLWHEREHAVING子句之间的相互作用非常重要。 WHEREHAVING的根本区别在于: WHERE在分组和聚合计算之前选择输入行(因此它控制哪些行 进入聚合计算),而HAVING在分组和聚合计算之后选择分组行。 因此,WHERE子句中不能包含聚合函数;试图用聚合来决定哪些行 应该成为聚合的输入是没有意义的。另一方面,HAVING子句总是 包含聚合函数。(严格地说,也允许编写不使用聚合的HAVING子句, 但那很少有用。同样的条件在WHERE阶段使用会更高效。)

在前面的例子中,我们可以在WHERE中应用城市名限制, 因为它不需要聚合。这样比把限制放到HAVING中更高效, 因为我们避免了对所有未通过WHERE检查的行进行分组和聚合计算。

选择哪些行进入聚合计算的另一种方法是使用FILTER,这是一个 按聚合分别指定的选项:

SELECT city, count(*) FILTER (WHERE temp_lo < 45), max(temp_lo)
    FROM weather
    GROUP BY city;
     city      | count | max
---------------+-------+-----
 Hayward       |     1 |  37
 San Francisco |     1 |  46
(2 rows)

FILTERWHERE非常相似,不同之处在于, 它只从其所附加到的那个特定聚合函数的输入中移除行。这里,count 聚合只统计temp_lo低于 45 的行;但max 聚合仍然应用于所有行,因此它仍会得到 46 这个读数。

提交更正

如果您发现文档中有不正确的内容、与您使用特定功能的经验不符或需要进一步说明,请使用此表单来报告文档问题。