开发者

SQL偏移类窗口函数 LAG、LEAD的用法小结

开发者 https://www.devze.com 2025-08-14 09:06 出处:网络 作者: 喻师傅
目录1.LAG()函数Demo:Demo:基础用法Demo:带偏移量的LAG()函数Demo:带默认值的LAG()函数Demo:LAG()函数,比较每一天的销售额与前一天的销售额的差异。2.LEAD()函数Demo:基础用法Demo:带偏移量的LEAD()函数Demo
目录
  • 1.LAG()函数
    • Demo:
    • Demo:基础用法
    • Demo:带偏移量的LAG()函数
    • Demo:带默认值的LAG()函数
    • Demo:LAG()函数,比较每一天的销售额与前一天的销售额的差异。
  • 2.LEAD()函数
    • Demo:基础用法
    • Demo:带偏移量的LEAD()函数
    • Demo:带默认值的LEAD()函数
    • Demo:LEAD()函数,比较每一天的销售额与下一天的销售额的差异。

在 SQL 中,偏移类窗口函数 LAG() 和 LEAD() 用于访问当前行的前几行或后几行的值。

1.LAG()函数

SQL偏移类窗口函数 LAG、LEAD的用法小结

LAG() 函数返回当前行的前几行的数据。

LAG(Expression, OffSetValue, DefaultVar) OVER (
    PARTITION BY [Expression]
    ORDER BY Expression [ASC|DESC]
);
  • expression: 你想要获取的列或表达式。
  • offset (可选): 你希望向前偏移的行数。默认是 1,表示获取前一行的数据。
  • default_value (可选): 如果当前行之前没有足够的行,返回的默认值。默认是 NULL,如果没有设置 default_value,且当前行是窗口的第一行或没有前几行数据时,返回 NULL
  • PARTITION BY (可选): 按某列分组计算窗口函数,类似于 GROUP BY。如果没有此项,整个数据集视为一个窗口。
  • ORDER BY: 按照某列排序,确定偏移的顺序。

Demo:

表格数据

sales 表,表结构和数据如下:

idmonthrevenue
1Jan100
2Feb150
3Mar200

Demo:基础用法

使用 LAG() 函数来获取按月排序后的“revenue”列的前一行的值

SEpythonLECT  id, 
		month, 
		revenue, 
		LAG(revenue) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan100NULL
2Feb150100
3Mar200150

Tips:

  • 第一行没有前一行,所以 prev_revenueNULL
  • 第二行的 prev_revenue 为第一行的 revenue 值(100)。
  • 第三行的 prev_revenue 为第二行的 revenue 值(150)。

Demo:带偏移量的LAG()函数

使用 LAG() 函数,并指定偏移量为 2,获取两行之前的“revenue”值。

SELECT  id, 
		month, 
		revenue, 
		LAG(revenue, 2) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan100NULL
2Feb150NULL
3Mar200100

Tips:

  • 第一行和第二行都没有两行之前的记录,所以 prev_revenueNULL
  • 第三行的 prev_revenue 为第一行的 revenue 值(100)。

Demo:带默认值的LAG(LPBXixK)函数

使用 LAG() 函数,并指定默认值为 0,当无法获取前一行的值时返回默认值。

SELECT  id, 
		month, 
		revenue, 
		LAG(revenue, 1, 0) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan1000
2Feb150100
3Mar200150

Tips:

  • 使用 LAG(revenue, 1, 0) 来获取前一行的“revenue”值,如果没有前一行则返回默认值 0。
  • 第一行没有前一行,所以 prev_revenue 为 0。
  • 第二行的 prev_revenue 为第一行的 revenue 值(100)。
  • 第三行的 prev_revenue 为第二行的 revenue 值(150)。

Demo:LAG()函数,比较每一天的销售额与前一天的销售额的差异。

SELECT
    sale_date,
    amount,
    LAG(amount, 1, 0) OVER (ORDER BY sale_date) AS previous_day_amount,
    amount - LAG(amount, 1, 0) OVER (ORDER BY sale_date) AS difference
FROM sales;
  • LAG(amount, 1, 0):这行的 LAG 函数表示获取前一天(前一行)的 amount 列的值,如果前一天没有数据(例如第一行),则返回 0
  • 通过 ORDER BY sale_date,确保按日期顺序排列数据。
sale_dateamountprevious_day_amountdifference
2025-01-011000100
2025-01-0215010050
2025-01-0320015050
2025-01-04180200-20

2.LEAD()函数

SQL偏移类窗口函数 LAG、LEAD的用法小结

LEAD() 函数与 LAG() 类似,但它返回的是当前行的后几行的数据。

LEAD(Expression, OffSetValue, DefaultVar) OVER (
    PARTITION BY [Expression]
    ORDER BY Expression [ASC|DESC]
);
  • expression: 你想要获取的列或表达式。
  • offset (可选): 你希望向前偏移的行数。默认是 1,表示获取前一行的数据。
  • default_value (可选): 如果当前行之前没有足够的行,返回的默认值。默认是 NULL,如果没有设置 default_value,且当前行是窗口的第一行或没有前几行数据时,返回 NULL
  • PARTITION BY (可选): 按某列分组计算窗口函数,类似于 GROUP BY。如果没有此项,整个数据集视为一个窗口。
  • ORDER BY: 按照某列排序,确定偏移的顺序。

Demo:基础用法

使用 LEAD() 函数来获取按月排序后的“revenue”列的后一行的值。

SELECT  id, 
		month, 
		revenue, 
		LEAD(revenue) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100150
2Feb150200
3Mar200NULL

Tips:

  • 第一行的 next_revenue 为第二行的 revenue 值(150)。
  • 第二行的 next_revenue 为第三行的 revenue 值(200)。
  • 第三行没有后续行,所以 next_revenue 为 NULL。

Demo:带偏移量的LEAD()函数

使用 LEAD() 函数,并指定偏移量为 2,获取两行之后的“revenue”值。

SELECT  id, 
		month,
		revenue, 
		LEAD(revenue, 2) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100200
2Feb150NULL
3Mar200NULL

Tips:

  • 使用 LEAD(revenue, 2) 来获取两行之后的“revenue”值。
  • 第一行的 next_revenue 为第三行的 revenue 值(200)。
  • 第二行和第三行都没有两行之后的记录,所以 next_revenue 为 NULL。

Demo:带默认值的LEAD()函数

使用 LEAD() 函数,并指定默认值为 0,当无法获取后一行的值时返回默认值。

SELECT id, month, revenue, LEAD(revenue, 1, 0) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100150
2Feb150200
3Mar2000

Tips:

  • 使用 LEAD(revenue, 1, 0) 来获取后一行的“revenue”值,如果没有后一行则返回默认值 0。
  • 第一行的 next_revenue 为第二行的 revenue 值(150)。
  • 第二行的 next_revenue 为第三行的 revenue 值(200)。
  • 第三行没有后一行,所以 next_revenue 为 0。

Demo:LEAD()函数,比较每一天的销售额与下一天的销售额的差异。

SELECT
    sale_date,
    amount,
    LEAD(amount, 1, 0) OVER (ORDER BY sale_date) AS next_day_amount,
    LEAD(amount, 1, 0) OVER (ORDER BY sale_date) - amount AS difference
FROM sales;
  • LEAD(amount, 1, 0):这行的 LEAD 函数表示获取下一天(下一行)的 amount 列的值。如果下一天没有数据(例如最后一行),则返回 0
  • 通过 ORDER BY sale_date,确保按日期顺序排列数据。
sale_dateamountnext_day_amountdifference
2编程客栈025-01-0110015050
2025-01-0215020050
2025-01-03200180-20
2025-01-041800-180

最后再来一个小练习(lc会员题):查找电影院所有连续可用的座位。

SQL偏移类窗口函数 LAG、LEAD的用法小结

SQL偏移类窗口函数 LAG、LEAD的用法小结

WITH t1 AS (
    SELECT
        seat_id,  -- 选择座位ID
        free,  -- 选择当前座位的空闲状态
        lag(free, 1, 999) OVER() AS pre,  -- 获取当前座位前一个座位的空闲状态,默认值为 999
        lead(free, 1, 999) OVER() AS next  -- 获取当前座位后一个座位的空闲状态,默认值为 999
    FROM Cinema  -- 从 Cinema 表中选择数据
)

SELECT
    seat_id  -- 返回座位ID
FROM t1  -- 从 t1 子查询中选择数据
WHERE 
    free = 1  -- 当前座位为空闲
    AND (pre = 1 OR next = 1)  -编程客栈- 前一个座位或后一个座位为空闲
ORDER BY seat_id;  -- 按座位ID升序排序

思路:

  1. lag(free, 1, 999) 和 lead(frephpe, 1, 999):

    • lag(free, 1, 999) 用于获取当前座位前一个座位的 free 值(默认为 999,表示没有前一个座位)。
    • lead(free, 1, 999) 用于获取当前座位后一个座位的 free 值(默认为 999,表示没有后一个座位)。
  2. free = 1 和 (pre = 1 OR next = 1):

    • 只选择当前座位是空闲的 (free = 1)。
    • 选择那些前一个或后一个座位也是空闲的 (pre = 1 OR next = 1),表示这些座位是连续空闲的。
  3. ORDER BY seat_id:

    • 确保最终返回的结果按座位 ID 升序排序。
seat_idfree
11
20
31
41
51

通过执行查询,得到的 t1 子查询结果:

seat_idfreeprenext
119990
2011
3101
4111
511999

从 t1 中筛选出满足 free = 1 且 (pre = 1 OR next = 1) 的行,得到的结果:

seat_id
3
4
5

 到此这篇关于SQL偏移类窗口函数 LAG、LEAD的用法小结的文章就介绍到这了,更多相关SQL偏移类窗口函数 内容请搜索编程客栈(www.devze.com)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程客栈(www.devze.com)!

0

精彩评论

暂无评论...
验证码 换一张
取 消

关注公众号