如何解决AWS Glue如何工作?
我在AWS Glue上以ETL身份阅读了多个帖子。但是我收不到。 有人可以用简单的词来解释AWS Glue的工作原理吗?它创建了ENI,但它的用途是什么?我读过某个地方说AWS Glue作业在AWS Glue专用子网内运行,是真的吗?能用架构图解释吗?另外,为什么在创建Glue连接时需要提供VPC?
解决方法
为使概念尽可能简单,请考虑将AWS Glue作为Spark,在其中编写Python / Scala脚本以执行可执行的特定数据处理任务,例如,使用GlueContext的Python脚本从S3存储桶中读取CSV文件并将其存储为JSON。
关于网络和VPC,您可以在VPC和AWS Glue之间建立专用连接。您可以使用此连接使AWS Glue无需通过公共互联网即可与VPC中的资源进行通信。使用VPC,您可以控制网络设置,例如IP地址范围,子网,路由表和网络网关。
AWS胶水概念:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。