如何解决总计创建Plotly瀑布图的最佳做法?
目标:我有一个可行的解决方案,但是由于我只是在学习熊猫,所以我在探索是否有更好的方法。我有一个包含每月时间段的财务数据集,并且正在使用熊猫按财务季度分组。我还在Plotly的瀑布图上绘制了这些数据,显示了会计季度和会计年度的总计。 Plotly的瀑布函数要求总行与相对(季度)数据交织。
当前解决方案:我有一个可行的解决方案...
# written from memory,this may not run
quarters = df.groupby( pd.PeriodIndex(df,freq='Q-JUN')
years = df.groupby( pd.PeriodIndex(df,freq='A-JUN')
combined = pd.concat(quarters,years)
我面临的挑战是,对行进行排序需要对所有元素使用相同的时间,因此我必须为两个表中的每一个创建一个额外的时间戳列,然后追加然后进行排序。它可以工作,但似乎我缺少一种更短/更简单/更快的方法。
我还尝试了一种按季度进行分组的方法,然后使用groupby.apply()函数对每个组求和,并在.apply()函数将所有组连接在一起之前追加总行。这比第一个解决方案要复杂得多,所以似乎我没有学到更好的东西。
我尝试将df.pivot_table()方法与总行的边距一起使用,但是遇到了一个限制,即该函数将无法在同一调用中处理计算的列和边距。
问题:瀑布图的预期工作流程是什么?从数据框到具有小计的numpy数组是否存在预期的模式?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。