与大多数其他关系数据库产品一样,PostgreSQL支持 聚合函数。聚合函数从多行输入中计算出单个结果。 例如,有一些聚合函数可在一组行上计算count(计数)、 sum(和)、avg(平均值)、 max(最大值)和min(最小值)。
例如,我们可以用下面的语句找出所有记录中最低温度读数的最高值:
SELECT max(temp_lo) FROM weather;
max ----- 46 (1 row)
如果我们想知道该读数出现在哪个城市(或哪些城市),可能会尝试:
SELECT city FROM weather WHERE temp_lo = max(temp_lo); WRONG
但这样行不通,因为聚合函数max不能用于 WHERE子句中(存在这个限制是因为WHERE 子句决定哪些行会被纳入聚合计算;因此显然它必须在聚合函数计算之前求值。) 不过,这类情况下通常可以把查询改写成能够得到所需结果的形式,这里我们通过使用 子查询来做到这一点:
SELECT city FROM weather
WHERE temp_lo = (SELECT max(temp_lo) FROM weather);
city
---------------
San Francisco
(1 row)
这样做是可以的,因为子查询是一次独立的计算,它会与外层查询分开计算自己的聚合。
聚合与GROUP BY子句结合使用时也非常有用。例如,我们可以得到 每个城市的读数个数,以及该城市观测到的最低温度中的最高值:
SELECT city, count(*), max(temp_lo)
FROM weather
GROUP BY city;
city | count | max
---------------+-------+-----
Hayward | 1 | 37
San Francisco | 2 | 46
(2 rows)
这样每个城市都会得到一行输出。每个聚合结果都是在与该城市匹配的表行上计算出来的。 我们可以使用HAVING来过滤这些分组行:
SELECT city, count(*), max(temp_lo)
FROM weather
GROUP BY city
HAVING max(temp_lo) < 40;
city | count | max ---------+-------+----- Hayward | 1 | 37 (1 row)
这样只会得到所有temp_lo值都低于 40 的城市的结果。 最后,如果我们只关心名称以“S”开头的城市, 可以这样做:
SELECT city, count(*), max(temp_lo)
FROM weather
WHERE city LIKE 'S%' -- (1)
GROUP BY city;
city | count | max
---------------+-------+-----
San Francisco | 2 | 46
(1 row)
|
|
理解聚合与SQL的WHERE和 HAVING子句之间的相互作用非常重要。 WHERE和HAVING的根本区别在于: WHERE在分组和聚合计算之前选择输入行(因此它控制哪些行 进入聚合计算),而HAVING在分组和聚合计算之后选择分组行。 因此,WHERE子句中不能包含聚合函数;试图用聚合来决定哪些行 应该成为聚合的输入是没有意义的。另一方面,HAVING子句总是 包含聚合函数。(严格地说,也允许编写不使用聚合的HAVING子句, 但那很少有用。同样的条件在WHERE阶段使用会更高效。)
在前面的例子中,我们可以在WHERE中应用城市名限制, 因为它不需要聚合。这样比把限制放到HAVING中更高效, 因为我们避免了对所有未通过WHERE检查的行进行分组和聚合计算。
选择哪些行进入聚合计算的另一种方法是使用FILTER,这是一个 按聚合分别指定的选项:
SELECT city, count(*) FILTER (WHERE temp_lo < 45), max(temp_lo)
FROM weather
GROUP BY city;
city | count | max
---------------+-------+-----
Hayward | 1 | 37
San Francisco | 1 | 46
(2 rows)
FILTER和WHERE非常相似,不同之处在于, 它只从其所附加到的那个特定聚合函数的输入中移除行。这里,count 聚合只统计temp_lo低于 45 的行;但max 聚合仍然应用于所有行,因此它仍会得到 46 这个读数。
如果您发现文档中有不正确的内容、与您使用特定功能的经验不符或需要进一步说明,请使用此表单来报告文档问题。