如何解决从AWS Glue加载Parquet文件到Redshift
有一个AWS Glue搜寻器,该爬行器正在使用包含木地板文件的S3目录中的所有表创建数据目录。
我需要将这些文件/表的内容复制到Redshift表中。
我有一些表,其中Redshift无法支持Parquet文件数据大小。 VARCHAR(6635)
是不够的。
在理想情况下,想要截断这些表。
如何使用COPY命令将此数据加载到Redshift? 如果使用频谱,我只能从外部表向Redshift表使用INSERT INTO,我知道这比批量复制要慢吗?
解决方法
您可以使用字符串来代替varchar(6635)(也可以在目录中进行编辑),如果不能,您可以详细介绍一下,其中的文件位于拼花地板中,大多数数据转换参数 该副本所提供的内容不能像Escape,null等那样使用。.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。