aws-glue - 编程之家

我想知道是否有一种方法可以使用Glue ETL作业来扁平化深度嵌套的JSON？它具有嵌套数组。我试图在JSON上

如果您使用EC2托管的Zeppelin笔记本，在我看来，这意味着根据该教程，可以使用AWS Glue库：<a href="https://do

我正在使用AWS胶水运行pyspark来从目录中读取动态框架（redshift中的数据），然后将其以csv格式写入s3。我

我想运行GLUE作业，存储过程代码开始。我有一个SQL存储过程，想在GLUE作业的自动生成的pyspark代码中调

我试图使用Glue数据库连接来连接到Redshift。我按照本教程<a href="https://docs.aws.amazon.com/glue/latest/dg/setup-vpc-

我正在尝试使用Java创建作业脚本。在AWS Glue Console中，我只能找到“ Python，Spark”，这意味着我们根本无

我正在寻找一种通过rest api调用AWS Glue的方法。另外，我不想使用python或dotnet SDK。 AWS Glue是否提供可以在

在AWS Glue中，尽管我阅读了文档，但是我并没有一窍不通。以下是我的理解。关于抓取工具：这将

有人可以解释为什么从sdk中访问时，aws粘胶工作流为何具有空的默认运行属性而没有图形？当在aws控制

我有一个Glue作业，用于将数据插入S3位置。我想将数据插入文件夹中的特定CSV文件中，但是胶水作业在

运行一个非常标准的Python Glue作业，该作业最近已在其他文件上运行。对于新文件，作业失败，并显示以

我正在尝试在AWS Glue上运行现有的Spark（Scala）代码。此代码使用<code>spark.read.option("jdbc")</code

<strong>要求</strong>：我需要完成一项胶粘工作，才能将aws-dynamodb（地图和列表的嵌套结构组合）数据输

对于Python DynamicFrame，如何仅检索列值？ <a href="https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-crawler-pyspark-ext

在AWS Glue作业中，为了从DB或S3检索数据，我们可以使用两种方法。 1）使用Crawler 2）使用直接连接到DB或S

在AWS Glue作业中，我们可以编写一些脚本并通过作业执行脚本。在AWS Lambda中，我们也可以编写相同

我的要求是使用python脚本从AWS Glue数据库读取数据到数据框。当我研究时，我与图书馆-“ awswrangler”战

我用Java编写了一个批处理作业。我的批处理作业基本上每天运行一次，其逻辑是仅使Rest调用其他一些api

我在Glue搜寻器中创建了一个JDBC连接，以从Redshift表中读取模式。搜寻器搜寻Redshift列，但在Glue数据目录

我有一个从AWS数据源获取记录的代码。没有功能映射到记录后，记录数量突然下降。以下代码提供了1900