如何解决为什么自定义尺寸在case语句中不起作用数据工作室,谷歌分析
我在Google数据工作室中遇到问题。我正在创建一个case语句,该语句在几个不同的维度中查找关键字并将其相应地分类。在添加自定义尺寸之前,所有这些都可以正常工作。对于Google而言,see语句有效,但不返回任何内容。
CASE
WHEN CONTAINS_TEXT(PAGE,"Heart") THEN "Cardiology"
WHEN PAGE = "Diabetes.website.com" THEN "Diabetes"
End
上面的方法很好
CASE
WHEN CONTAINS_TEXT(PAGE,"Heart") THEN "Cardiology"
WHEN PAGE = "Diabetes.website.com" THEN "Diabetes"
WHEN WEB_SUBJECT = "Hypertension" THEN "Cardiology"
END
以上内容有效,但使用时为空白。 Web_subject是Google Analytics(分析)中定义的自定义维度。
任何帮助都将不胜感激。这个让我难过。
更新: 因此,将自定义维度表达式的格式更改为REGEX可以返回该特定条件的结果,但是现在不显示任何其他结果。我觉得这可能是因为所有数据都位于其中。
更多情况下,本例中的数据源是一个汇总的Google Analytics(分析)帐户,因此它包含来自10多个域的分析。我试图做的是使用不同的维度将来自不同域的页面视图和用户归为一组。例如,如果用户选择过滤器“糖尿病”,我想返回以下所有网页浏览量: 域A,页面标题包含x 域B,其中customDimesnion 1 = Y 等等
这是我当前对CASE语句的理解:
case
when contains_text(Page,'biosimilars-confidence') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Oncologie).*') OR CONTAINS_TEXT(Page,'oncology') OR contains_text(Page,'rrmm-challenges') OR contains_text(Page,'oncologyhighlights2020') OR CONTAINS_TEXT(Page,'ASCO') OR CONTAINS_TEXT(Page Title,'cancer') OR contains_text(Page Title,'Oncology') OR contains_text(Page Title,'ASCO') THEN "Oncology"
when CONTAINS_TEXT(Page,'DOMAINB') OR contains_text(Page,'eprint') THEN "Eprint"
when CONTAINS_TEXT(Page,'diabetes') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Diabetes).*') OR contains_text(Page,'hypoglycemia') OR contains_text(Page,'glp1ras') OR contains_text(Page Title,'Diabetes') OR contains_text(Page Title,'hyperglycemia') OR contains_text(Page Title,'diabetes') OR contains_text(Page Title,'ADA') OR contains_text(Page Title,'GLP-1') then "Diabetes/Endocrinology"
when CONTAINS_TEXT(Page,'cardiology') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Cardiologie).*') OR contains_text(Page Title,'Cardiology') OR contains_text(Page Title,'Heart failure') then'Cardiology'
when contains_text(Page,'gastro') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Gastro-enterologie).*') OR contains_text(Page Title,'Gastroenterology') then "Gastroenterology"
when contains_text(Page,'rheumatology') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Reumatologie).*') OR contains_text(Page Title,'Rheumatology') OR contains_text(Page Title,'adalimumab') OR CONTAINS_TEXT(Page Title,'arthritis') OR CONTAINS_TEXT(Page Title,'EULAR') OR contains_text(Page Title,"joint") then "Rheumatology"
when CONTAINS_TEXT(Page,'migraine') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Neurologie).*') OR contains_text(Page Title,'Neurology') OR contains_text(Page Title,"Ataxia") OR contains_text(Page Title,"EAN 2020") then "Neurology"
when Page = 'DOMAINA.com' OR contains_text(Page,'training') OR Page = 'ime.DOMAINA.com' then "Corporate site traffic"
when contains_text(Page Title,'Gynaecology ') then "Gynaecology "
when CONTAINS_TEXT(Page Title,'Dermatology') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Dermatologie).*') OR contains_text(Page Title,'eczema') OR contains_text(Page Title,'Laser hair removal') then "Dermatology"
when CONTAINS_TEXT(Page Title,'COVID-19') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Coronavirus (COVID-19)).*') then "COVID-19"
WHEN CONTAINS_TEXT(Page Title,'General practice') then "General practice"
when contains_text(Page Title,'Haematology') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Hematologie).*') OR contains_text(Page Title,'EHA25') then "Haematology"
when contains_text(Page Title,'Mental health') OR CONTAINS_TEXT(Page Title,'Psychology') then 'Mental health'
when contains_text(Page Title,'penile length') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Urologie).*') then "Urology"
when contains_text(Page Title,'ERS 2019') OR REGEXP_MATCH(WEBSITE subject,'.*(?i)(Longziekten).*') THEN "Lung diseases"
when contains_text(Page,'noonan')Then "Genetics"
when REGEXP_MATCH(WEBSITE subject,'.*(?i)(Farmacie).*') then 'Pharmacy'
when REGEXP_MATCH(WEBSITE subject,'.*(?i)(Heelkunde).*') then 'Surgery'
when REGEXP_MATCH(WEBSITE subject,'.*(?i)(Huisartsgeneeskunde).*') then 'Family medicine'
when REGEXP_MATCH(WEBSITE subject,'.*(?i)(Infectieziekten).*') then 'Infectious Diseases'
when REGEXP_MATCH(WEBSITE subject,'.*(?i)(Overig).*') then 'Other/Uncategorized'
when REGEXP_MATCH(WEBSITE subject,'.*(?i)(Voeding).*') then 'Nutrition'
else 'Other/Uncategorized'
end
我已经匿名了一些,所以如果看起来很奇怪,那就是为什么。 我可能完全以错误的方式进行此操作。另一件事要注意,域名存储在PAGE维度中。
解决方法
更新(扩展案例)
0)原始扩展案例
这可能是由于:
contains_text(Page Title,'ADA')
在ADA
周围添加单词边界可以解决问题,确保仅包含ADA
的单词不会被捕获到相应的WHEN
子句中>
REGEXP_MATCH(Page Title,".*(?i)(\\bADA\\b).*")
一种替代方法是遵循以下两个步骤:
1)Field_CONCAT
创建以下数据源级别的Calculated Field至CONCAT
字段为一个合并的字段:
CONCAT(Page,",WEBSITE subject,Page Title)
2)New_CASE
在下面创建CASE
语句:
- 字段 :其中
Field_CONCAT
代表上面创建的字段; - |或| :
|
管道运算符|
用作OR
的RegEx版本
- 转义序列 :
\\
用于转义特殊的RegEx字符,例如(
,|
,{{1} }等; - 单词边界 :在
.
(以及ADA
)的任一侧都添加了单词边界,以确保仅包含ASCO
不属于ada
WHEN子句的一部分:
Diabetes/Endocrinology
添加了一个New Page to the Google Data Studio Report和一个GIF来演示:
原始POST
0)CASE
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(biosimilars-confidence|Oncologie|oncology|rrmm-challenges|oncologyhighlights2020|\\bASCO\\b|cancer).*") THEN "Oncology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(DOMAINB|eprint).*") THEN "Eprint"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(diabetes|hypoglycemia|glp1ras|hyperglycemia|\\bADA\\b|GLP-1).*") THEN "Diabetes/Endocrinology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(cardiology|Cardiologie|Heart failure).*") THEN 'Cardiology'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(gastro|Gastro-enterologie|Gastroenterology).*") THEN "Gastroenterology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(rheumatology|Reumatologie|adalimumab|arthritis|EULAR|joint).*") THEN "Rheumatology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(migraine|Neurologie|Neurology|Ataxia|EAN 2020).*") THEN "Neurology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(DOMAINA\\.com|training|ime\\.DOMAINA\\.com).*") THEN "Corporate site traffic"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Gynaecology).*") THEN "Gynaecology "
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Dermatology|Dermatologie|eczema|Laser hair removal).*") THEN "Dermatology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(COVID-19|Coronavirus \\(COVID-19\\)).*") THEN "COVID-19"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(General practice).*") THEN "General practice"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Haematology|Hematologie|EHA25).*") THEN "Haematology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Mental health|Psychology).*") THEN 'Mental health'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(penile length|Urologie).*") THEN "Urology"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(ERS 2019|Longziekten).*") THEN "Lung diseases"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(noonan).*") THEN "Genetics"
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Farmacie).*") THEN 'Pharmacy'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Heelkunde).*") THEN 'Surgery'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Huisartsgeneeskunde).*") THEN 'Family medicine'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Infectieziekten).*") THEN 'Infectious Diseases'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Overig).*") THEN 'Other/Uncategorized'
WHEN REGEXP_MATCH(Field_CONCAT,".*(?i)(Voeding).*") THEN 'Nutrition'
ELSE 'Other/Uncategorized'
END
请注意,问题中的CASE
语句和此建议未明确声明ELSE NULL
子句,因此默认情况下,ELSE
值被视为 NULL 。
1)调整了案例
尝试了CASE
语句,它可以正常工作!初始CASE语句的一项调整是包含逻辑运算符,ELSE
:
OR
2)替代案例
此外,您还可以查看下面的CASE
语句是否可以解决问题;它使用REGEXP_MATCH
函数,并确保字段包含 CASE
WHEN CONTAINS_TEXT(PAGE,"Heart") OR WEB_SUBJECT = "Hypertension" THEN "Cardiology"
WHEN PAGE = "Diabetes.website.com" THEN "Diabetes"
END
的各个值以及添加不区分大小写的标记 .*
,匹配(?i)
,Hypertension
,hypertension
等
HYPerTENsion
3)后续步骤和GIF
如果上述方法仍不能解决问题,您能否详细说明一下屏幕截图并提供一些示例数据(删除或替换任何敏感信息);随时将数据添加到This Editable Google Sheet(也在下面的报告和GIF中使用)。
Google Data Studio Report和GIF来详细说明上述内容:
,首先,@ Nimantha谢谢您使我在解决此问题的道路上走得更远,并为我提供了很多教训,以备不时之需。
事实证明,问题是我的“通用”分析标签位于由不同的标签管理器容器实现的多个站点上。我在标记容器中定义了自定义维度,以将数据层信息传递给Google Analytics(分析)。问题是我没有将任何值传递给其他任何域上的自定义维度。这导致CASE语句崩溃,因为当自定义维度值仅存在于一个域中时,它仅返回该域中的页面。
要解决此问题,我进入了所有容器中的所有GA标签,并匹配了自定义尺寸,如果我没有实际值,则传入(未设置)。现在,在使用上面Nimantha的CASE语句时,我可以看到所有页面开始出现。只是不幸的是,他们从现在开始就在人口稠密中,但是至少可以正常工作!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。