如何解决如何在 Postgresql (pgAdmin4) 中导入日期样式不一致的数据集?
我在日期列中有一个数据类型不一致的数据集,如下所示:
order_date
04/30/19 09:27
2004-12-19 2:38:00 PM
我想通过创建一个具有相同列和数据类型的临时表来将此数据集导入我的本地主机 Postgresql。
order_date 列中存在数据类型错误。我尝试将数据类型更改为文本,以便在导入数据集后更正 SQL 查询不一致的问题。
导入成功,但日期值与原始值不同:
04/30/19 09:27
04/12/19 14:38
似乎 Postgresql 将原来的 yyyy-mm-dd...
更改为 mm/dd/yy
日期样式。我无法对这个数据集做任何事情,因为我什至无法将带有正确日期数据的它导入 SQL。 (数据集约200Mbytes,CSV文件)
我想知道如何将上述日期样式不一致的数据集导入到 Postgresql localhost 数据库。
提前致谢。
解决方法
典型的 ETL 挑战,您必须将一些输入(又名垃圾)转换为有用的东西。您基本上需要这些步骤,其中第 3 步是最重要和最耗时的部分:
- 为输入的所有字段创建一个只有文本字段的表格
- COPY 此表的输入
- 验证此表中的数据并使用一致正确的数据更新记录和列
- 将转换后的数据插入目标表
- 清空(或删除)您在第 1 步中创建的表
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。