如何解决如何在表中检查SQL如果没有字符串连接是否有多列集
假设我在一个表中有3列,其值如下:
table_1:
A | B | C
-----------------------
'xx' | '' | 'y'
'x' | 'y' | 'x'
'x' | 'x' | 'y'
'x' | 'yy' | ''
'x' | '' | 'yy'
'x' | 'y' | 'y'
我有一个结果集(SQL SELECT语句的结果),我想在上面的表中标识该结果集是否存在:
[
('x','x','y')
('x','y','y')
]
如果我比较了简单字符串连接的结果,则此结果集将匹配5行(共6行),而不是上表中的2行。我将简单比较一下以下结果:SELECT concat(A,B,C) FROM table_1
我可以通过比较以下更复杂的字符串连接函数的结果来解决此问题:SELECT concat('A=',A,'_','B=','C=',C )
但是:
- 我不想在诸如
_
或=
之类的字符串连接中使用任何硬编码的特殊分隔符- 因为数据中可能包含任何字符
- 例如:B列中的某处可能是这个值:
xx_C=yy
- 例如:B列中的某处可能是这个值:
- 这不是一个干净的解决方案
- 因为数据中可能包含任何字符
- 我根本不想使用字符串连接,因为这是一个丑陋的解决方案
- 这使属性之间的“距离”消失了
- 不够普遍
- 也许我有不同数据类型的列,我不想转换为基于STRING的列
问题:
是否可以在不使用字符串连接的情况下以某种方式解决此问题? 这个多列值检查问题有简单的解决方案吗?
我想在BiqQuery中解决此问题,但是我对每种关系数据库/数据仓库的通用解决方案感兴趣。
谢谢!
CREATE TABLE test.table_1 (
A STRING,B STRING,C STRING
) AS
SELECT * FROM (
SELECT 'xx','','y'
UNION ALL
SELECT 'x','x'
UNION ALL
SELECT 'x','yy',''
UNION ALL
SELECT 'x','yy'
UNION ALL
SELECT 'x','y'
)
SELECT A,C
FROM test.table_1
WHERE (A,C) IN ( -> I need this functionality
SELECT 'x','y'
);
解决方法
使用join
:
SELECT t1.*
FROM test.table_1 t1 JOIN
(SELECT 'x' as a,'x' as b,'y' as c
UNION ALL
SELECT 'x','y','y'
) t2
USING (a,b,c);
,
以下是我想到的最通用的方法(BigQuery标准SQL):
#standardSQL
SELECT *
FROM `project.test.table1` t
WHERE t IN (
SELECT t
FROM `project.test.table2` t
)
您可以使用问题中的示例数据来测试,玩转上面的示例
#standardSQL
WITH `project.test.table1` AS (
SELECT 'xx' a,'' b,'y' c UNION ALL
SELECT 'x','x' UNION ALL
SELECT 'x','x','y' UNION ALL
SELECT 'x','yy','' UNION ALL
SELECT 'x','','yy' UNION ALL
SELECT 'x','y'
),`project.test.table2` AS (
SELECT 'x' a,'x' b,'y'
)
SELECT *
FROM `project.test.table1` t
WHERE t IN (
SELECT t
FROM `project.test.table2` t
)
有输出
Row a b c
1 x x y
2 x y y
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。