如何解决使用24HR时间块数据查询在RStudio中使用K均值
您好,在此先感谢能帮助我的人!
因此,基本上我对群集没有足够的经验,我试图使用K均值来对某些数据进行群集,尽管由于部分数据是时间块,我对所获得的结果有些困惑。
因此,例如,对于数据中的每个对象,在一列中以每小时平均值(0-23)进行24次读数,而下一列是特定变量的每小时平均值,K表示适当的方式将其群集?
例如,当将K数选择为3并使用Kmeans(data,3)时,它将返回0-23个时间段的簇均值和相关变量。这似乎不正确,因为数字0-23的平均值无关紧要,也不会让我绘制Kmeans的任何结果。
我觉得这是不对的,也许答案可能与让K表示在0-23个时间段上运行多次有关。例如,如果有0到23个时间块观测值的80个实例,那么K表示是否应该分别运行80次以正确地对数据进行聚类?
非常感谢您的帮助,谢谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。