impala - 编程之家

我正在遵循<a href="https://stackoverflow.com/questions/25989187/unable-to-create-table-in-hive-reading-a-csv-from-hdfs">this</a>解

我无法将表格保存到几种不同的来源中。 我尝试了以下方法： <ul> <li> <code>dataset.toPandas().to_csv(&#3

我在HUE中有一个表，如： <pre><code>ID,ProductID 1,1 1,2 1,1 1,3 1,1 1,2 1,1 1,3 2,1 2,2 2,2 2,2 2,1 2,2 2,2 2,2 </c

我有一个扁平的层次结构，深约10层。有一个钥匙，但是很遗憾，这个钥匙没有被遵守，所以不能用于我

每次遇到此错误，我都尝试使用impyla连接到impala <pre><code> Could not start SASL: b'Error in sasl_client_start (

我有2个Impala查询： <pre><code>select * from table_1 where id ='5f4d3f626d248400285ccd35' or id ='5f50f94f

对于Parquet表，我使用<code>SHOW FILES IN db_name.parquet_table_name</code>来获取Parquet表的所有分区名称，大小和路

给出以下原始数据，如何将它们分组以在所需的输出中具有rank字段：内置的density_rank和rank函数在这里

kudu群集由40多个平板电脑服务器，24CORE48G 组成该表有16列，每行50字节，按哈希16个存储分区划分<

我来自不同传感器单元的数据与 Hadoop 中的 unix_time stam 一起出现。使用 FIRST 和 LAST 语句在 SQL 中获取每

我是Impala的新手-当我们如下联接两个表时，我们收到以下错误消息。 Impala不支持相关子查询的> =

要求： 使用按A分组并获取计数> 1的记录 例如： <pre><code>SELECT count(sk), id, sk FROM table x GROUP BY i

Kudu是否支持<code>UPDATE</code>的{{1}}部分的条件？我可以提供条件子句以仅基于插入值和目标表

因此，我正在使用 impala.dbapi ，并且我需要在蜂巢数据库中插入大量数据。有人告诉我可以使用<em

我正在一个新项目中工作，我有一个需要在impala表中执行选择的节点服务器，我遇到了问题，因为我的cl

我有配置单元表和分区表。我插入如下所示的分区表。如果不存在，它是自动创建分区。我

我运行此查询，它有效： <pre><code>insert into default.dw_partitioned_table partition (partition_islemtarih_s

我正在测试Apache Atlas Hive函数。我们公司与Presto Impala合作经营蜂巢，而Atlas找不到Presto Impala创建的餐桌

我在Cloudera 5.16和Python 3.6.10上使用pyodbc（用于kudu的impala驱动程序）对kudu表进行了升级。插入工作正常，

我需要为每个类别选择一个表中的所有群组，即使该类别在给定类别中缺失（并将0或NULL作为值）我需