如何解决如何使用相关错误预测 R 中整个数据库的未来销售额?
我第一次在当地公司实习,他们给我的任务是预测未来三个学期(18 个月)对某种产品库存的需求。首先,我用 MA 方法在 Excel 中完成了它,但结果不是最好,所以现在我正在尝试使用 R,但我陷入了下一个问题。我的数据是一个有 15.000 列的 excel,第一行是产品名称,接下来的 48 行是每个产品的销售额(数字),从 2017 年 1 月到 2020 年 12 月。
我想应用 R 中的 auto.arima 函数和其他预测方法/函数,并且我需要为每种方法一次对所有 15000 种产品执行此操作。我知道如何为 1 列执行此操作,但我在 R 方面不是很熟练,因此我在尝试同时为所有 15.000 列进行编程时遇到问题。另外,我需要一种方法来直接在 excel 中查找/显示每种方法的相关错误,因为我想选择不同方法之间误差最小的方法移动平均线、霍尔特温特斯等。目前我有这个,这给了我一个表格,其中包含使用 auto.arima 方法的单个产品(一列)的预测。
data <- read_excel("aceiteX.xlsx")
Y <- ts(data[,1],start = c(1),frequency=12)
modelo_arima <- auto.arima(Y,d=1,D=1,stepwise = FALSE,approximation = FALSE,trace = TRUE)
fcast <- forecast(modelo_arima,h= 19,level=c(95))
pronostico <- as.data.frame(fcast)
write.table(pronostico,file= "C:\\Users\\bro\\Documentos\\aceiteX.csv",sep=",")
我下一步的想法是使用 lapply 功能对所有产品执行此操作,显然有效,但这不是我需要的。我想要一个表格,显示从 2021 年 1 月到 2022 年 6 月每个产品的月度预测。然后,也许最后一行或不同的列可以显示该方法的相关错误,因为我想尝试多种方法( auto.arima、Holt-Winters 等)并选择最好的一个。
如果我能得到一张这样的表格,工作的其他部分就可以在 Excel 中轻松完成。任何建议、提示或秘密功能都将受到真正的重视。所以我的问题是,抽象地说,如何一次将预测函数应用于多列,以及如何在 Excel 文档中打印每个产品的方法的相关错误。非常感谢!
解决方法
好吧,我相信您的问题不是代码问题,而是一般的软件架构或解决方案风格问题。
无论您使用 lapply
还是 for
循环或其他什么。这里的问题是您需要找到一种方法来访问和识别每个产品(好吧,将每个产品视为一个独特的时间序列!)数据。完成后,您可以拆分训练数据和测试数据中的每个时间序列。只有这样,您才会生成与每个训练数据相关的预测,最后将结果与测试数据进行比较。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。