databricks - 编程之家

根据我们的AWS环境，我们有2种不同类型的SAG（服务帐户组）用于数据存储。一个SAG用于通用存储，另一

我正在使用Azure Data Factory运行我的databricks笔记本，该笔记本在运行时创建作业群集。现在，我想知道这

当我运行以下查询时： <pre><code>merge into test_records t using ( select id, "senior developer" title, country from

在加载数据之前，我需要从delta-lake表中删除某些数据。我可以从增量表中删除数据（如果存在），但是

<a href="https://github.com/MicrosoftDocs/azure-docs/issues/50030" rel="nofollow noreferrer">GitHub</a>中已经报告了此问题。我

我正在尝试从本地计算机将.txt文件导入数据砖笔记本（scala）。我进入数据部分，然后单击“添加数据

尝试使用databricks dbutils从Azure Key Vault中读取机密，但遇到以下异常： <pre><code> OpenJDK 64-Bit Server VM wa

我们计划在我们的环境中实施集中式元存储机制。在这种情况下，尝试了解如何将Metastore访问授予Databric

有什么方法可以从pyspark 2.4脚本中的Databricks群集中获取实例配置文件吗？我确实希望<code>df = df_have

我有一个如下所示的数据框： <pre><code>|------------|-----------|---------------|---------------| | Name | Type

我正在Databricks中编写Python，并且正在使用spark 2.4.5。我具有类似以下代码的功能： <pre><code>def v

我正在尝试将许多avro文件读入spark数据帧。它们都共享相同的s3文件路径前缀，因此最初我运行的是类似

我正在使用Databricks XML包读取和处理Wikipedia XML数据，但是不确定如何处理嵌套。 <pre><code>df = spark.read.

我正在尝试使用pyspark中的超空间创建索引。但是我遇到了这个错误 <pre><code>sample_data = [(1, "name1&#3

我一直在逐个字母跟踪<a href="https://docs.databricks.com/clusters/init-scripts.html#example-install-postgresql-jdbc-driver" rel

我有两个笔记本在数据块转换和链接的功能（具有所有功能）中。这是我在转换笔记本中正在处理

我有大约50 k xml文件，我想上传到ADLS / DBFS。是否可以将其作为zip文件上传并可以从ADLS / DBFS使用zip文件

我使用Event Spark从Event Hub进行流处理，并遇到以下问题。对于每个传入消息，我需要进行一些计算（无状

我正在尝试在Databricks上生成SF300和SF1000 TPCH数据。但是，我的脚本已经运行了24个小时以上，我想我做错

我是数据砖的新手。我正在为我的学校项目寻找公共大数据数据集，然后在以下链接上遇到了AWS公共数