如何解决标识由标志标识的组中的范围
| 我有下表:declare @table table (dates int,is_missing tinyint,group_id numeric(18))
insert into @table(dates,is_missing,group_id)
select 20110719,1
union all
select 20110720,1
union all
select 20110721,1
union all
select 20110722,1,1
union all
select 20110723,1
union all
select 20110724,1
union all
select 20110725,1
union all
select 20110726,1
union all
select 20110727,1
union all
select 20110728,3
union all
select 20110724,3
union all
select 20110725,3
union all
select 20110726,3
union all
select 20110727,3
select * from @table
order by group_id,dates
我想做的是返回每个组的日期范围,这些日期范围由漏掉的日期标记标识。为了使这一点更加清楚,查询的结果必须如下所示:
group_id start_date end_date days_count
1 20110719 20110721 3
1 20110723 20110725 3
1 20110727 20110727 1
3 20110724 20110725 2
3 20110727 20110727 1
is_missing标志基本上将每个组的范围分开。实际上,它说缺少日期,因此位于is_missing标志之间的所有其他日期都是我要查找其开始和结束日期以及其天数的组。
有没有简单的方法可以做到这一点?
非常感谢。
解决方法
这是使用
Common Table Expression (CTE)
和ROW_NUMBER()
的可能解决方案。这种类型的问题称为“ 4”。使用此堆栈溢出问题中使用的概念:sql仅按顺序排列的行进行分组,以下查询被公式化以针对您提供的数据产生所需的输出。
如果按ѭ5the和dates
列对表中存储的数据进行排序,则此查询将正常工作。我认为您的数据就是这种情况。如果没有,您可能需要调整解决方案。
根据Andriy M
提供的建议修改了查询。感谢Andriy M.
查询已更改,以便即使表中的日期值不按顺序也可以提供正确的输出。该问题的日期值存储在int
数据类型中,而不是日期格式。因此,下面提供了两个查询。如果表包含以“ 8”数据类型存储的日期值,则第一个查询将起作用;如果表包含以“ 10”或“ 11”数据类型存储的日期值,则第二个查询将起作用。
该查询仅在SQL Server versions 2005 and above
中有效。既然您已在sql-server-2008
下标记了您的问题,我认为这应该对您有用。
屏幕截图1显示了存储在表中的数据。屏幕截图2显示了针对表数据的以下查询的输出。
希望能有所帮助。
查询以“ 8”数据类型存储的日期值:
。
WITH cte AS
(
SELECT datenumeric,is_missing,group_id,datenumeric
- DENSE_RANK() OVER (PARTITION BY is_missing ORDER BY group_id,datenumeric) AS partition_grp
FROM dbo.table_data
)
SELECT cte.group_id,MIN(cte.datenumeric) AS start_date,MAX(cte.datenumeric) AS end_date,COUNT(cte.datenumeric) AS days_count
FROM cte
WHERE cte.is_missing = 0
GROUP BY cte.group_id,cte.partition_grp
ORDER BY cte.group_id,cte.partition_grp;
查询以“ 10”或“ 11”数据类型存储的日期值:
。
WITH cte AS
(
SELECT datevalue,DATEDIFF(DAY,datevalue)
- DENSE_RANK() OVER (PARTITION BY is_missing ORDER BY group_id,datevalue) AS partition_grp
FROM dbo.table_data
)
SELECT cte.group_id,MIN(cte.datevalue) AS start_date,MAX(cte.datevalue) AS end_date,COUNT(cte.datevalue) AS days_count
FROM cte
WHERE cte.is_missing = 0
GROUP BY cte.group_id,cte.partition_grp;
屏幕截图1:
屏幕截图2:
, 非常感谢Siva提供的出色解决方案,我认为如果数据中缺少一个日期,查询将失败。
因此我稍微修改了查询,并使用ROW_NUMBER()修复了该问题。
WITH cte AS
(
SELECT dates,ROW_NUMBER() OVER (ORDER BY group_id,dates) -
DENSE_RANK() OVER (PARTITION BY is_missing ORDER BY group_id,dates) AS partition_Id
FROM dbo.table_data
)
SELECT group_id,MIN(dates) AS start_date,MAX(dates) AS end_date,COUNT(*) AS days_count
FROM cte
WHERE is_missing = 0
GROUP BY group_id,partition_id
ORDER BY group_id,partition_id;
也许永远不会缺少日期。 :)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。