我有一个时间序列,并且从多台机器上收集了近两年的数据。每台机器每周记录一个样本。例如,对于
我正在尝试进行比例测试,但是出现错误,我无法解决。我的<code>DF</code>是指在两家不同医院接受过中
我没有在网上进行搜索,但是pyspark中是否存在可以执行ANOVA和Tukeys HSD的功能或库?还是我必须从头开始
我有一个人执行的多项活动,以及两个设备及其读数的相应多维值。我需要找到两个设备的读数之间的
我在线阅读了kruskal-wallis检验(KS检验),尽管最初被开发用来检验样本是否来自相同的人群以及形状是
我为 μ=-0.5 生成了两个 P 值直方图,一个用于两侧测试,另一个用于一侧测试。我注意到对于第一种情
我想在水平和功效方面比较卡方检验和具有连续性校正的检验。我的想法是迭代伯努利分布从 2 到 1200
我在spark数据框中有非常大的数据集,这些数据集分布在各个节点上。
我可以使用火花库<code>mean</code>进
我目前正在尝试寻找进行A / B测试以进行转化率分析的方法。举个例子:
考虑一个电子商务网站。
我只是看着<a href="https://en.wikipedia.org/wiki/Chi-squared_test" rel="nofollow noreferrer">https://en.wikipedia.org/wiki/Chi-squar
我有一个数据框,该数据框按作者的性别,他们在项目中的角色以及标识符(PMID)细分(见下文)。
我正在尝试为我的数据获得最佳分布。配件如下图所示完成,但是我需要测量以选择最佳的型号。我将
我有两个重叠的时间序列,即从图形上看根本没有任何滞后,但是当构建两列的VAR模型时,返回了异常
数据:
<pre><code>variant disease control total
A1 1 53 54
A2 6 2 8
A3 15 37 52
A4
如果您考虑使用此代码
<pre><code>ggbarplot(ToothGrowth, x = "dose", y = "len", add = "mean_se",
我正在尝试对列联表进行卡方检验
<pre><code>
Satisfied More Or Less Not At All Sat
Lower Class
我必须使用置换检验来测试(两个分类器的)两个ROC曲线的AUC是否不同(我不能使用<code>roc.test</code>函
我正在尝试分析微生物群落样本的beta多样性。我有两个因素(物质因素和星期因素),都具有3个水平,
据我了解,克鲁斯卡尔·瓦利斯(Kruskal Wallis)是对超过两个小组的测试
Mann-Whitney-U-Test仅用于2组
我想进行未配对的t检验。我有一个非常庞大的数据集,包含50万名参与者,只有21名参与者患有疾病。如