如何解决Excel数据清理
我正在寻找清理和整理Excel数据以进行分析和可视化的最佳方法。我需要的是将数据转换为一种属性类型的格式,即一列,每列顶部都有一个标题。您将在下面找到我要实现的目标的示例。之后,我想使用PowerBI创建图形概述。 我可以要求小费吗?
数据表:
第6-7行包含第一个实体,第8-9行包含第二个实体,
工作表存在的问题:
- 每个实体跨越两行
- 前4行无关,第五行包含标题
- 每个大约50行有一个分页符,其中包含空单元格
解决方法
我已经多次解决了这个问题:您从某个旧系统接收数据,该数据经过格式化后可以在面向字符的打印机上打印输出。
当我只需要执行一次时,我会使用公式仔细地对数据进行排序和过滤,以使第二行中的数据一直到第一行中的数据。然后我取消公式,进行排序,过滤和删除,直到获得所需的内容。
当我必须定期执行此操作时,我会在工作表的每一行上编写一个VBA脚本,识别相关的行或数据并将它们复制到其他位置(或删除不相关的行,尽管删除了其中的行)长纸需要很多时间。)
如果您希望它更复杂,则可以将数据读入某种对象结构,并以Excel或XML或任何您喜欢的方式写出该对象。
无论如何,没有简单的解决方案。但是,如果您知道自己的数据,则可以找到识别实体并将它们放在一行中的方法。
当然,最好的方法是与创建输出的人交谈,并要求他或她提供体面的CSV文件。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。