databricks - 编程之家

我在databricks环境中使用sparkR，并且试图加载使用RStudio创建的XGB模型。我将模型保存为.RData和.model

我正在使用<code>SparkR</code>和<code>sparklyr</code>在数据块中导入镶木地板文件。 <code>data1 = SparkR::read.d

与创建的数据框相比，仅需要更新现有表中已更改的行。因此，nownow，我会减去并获取更改后的行，但

我的实木复合地板文件中具有以下格式的扁平化输入数据： <a href="https://i.stack.imgur.com/7iT0C.png" rel=

我试图在git bash以及cmd中执行以下命令。但是它不起作用。已经使用pip install databricks-cli安装了databricks cl

我想使用PySpark查询Hive表（当前在本地运行，但将迁移到Databricks），但我一直遇到错误。凭借我不存在

我正在使用数据块将一些数据加载到现有的delta lake文件夹中。加载后，当我尝试立即访问以前的

我只是想使用在databricks中使用sparklyr导入的数据来查找日期列的最大值： <code>data %>% dplyr::select(

我在数据块中运行了此SQL查询，以检查镶木地板文件中列的不同值： <pre><code>SELECT distinct country FROM pa

是否可以在Databricks中创建数据库（sql）用户（类似于Oracle或MySql用户）？在社区版中似乎不可能。

运行<code>databricks-connect configure</code>之后，当我运行<code>databricks-connect test</code>时，我得到<code>"The sys

我开始探索与数据块的git集成，并成功在DEV中设置它，然后通过CICD，我可以对QA和PROD进行更改，但是我

我在Azure Data Lake中有一个CSV文件。我想通过DataBricks将此文件的类型更改为csv.gz。我可以将此文件

我有一个包含逗号分隔行和管道分隔行的文件，我需要将其导入到Databricks中。在Databricks / Spark中

我正在尝试在数据块上的Hive sql中选择一些名称带有某些特定单词的列。基于<a href="https://stackoverfl

我试图通过遵循<br/> <a href="https://docs.microsoft.com/en-us/azure/databricks/administration-guide/access-control/table-acl" rel=

我想通过在<code>Factor Analysis</code>中使用<code>dplyr::collect()</code>来执行<code>Databricks</code>，但是由于它的大

我们每天在Azure数据砖中运行计划的数据砖作业，并且该作业每天都成功运行。但是今天（2020年9月29日

我的同事在<code>pyspark</code>中使用<code>Databricks</code>，通常的步骤是使用<code>data = spark.read.format('delta&#

以下是一些与AWS S3存储桶中的Databricks流相关的查询。 <ol> <li> 在从S3存储桶流式传输读写文件（.csv