impala - 编程之家

我有下表， <div class="s-table-container"> <table class="s-table"> <头> <tr> <th>用户 ID</th> <th>siteId</th> <th>logged_time

我们有一个使用impala jdbc 连接运行少量SQL 的spark 应用程序。应用程序在不同的时间完成，如 15 分钟、1

<pre><code>select case when concat('ACC','-',NVL(trim(bvmo.booking),''),'-',NVL(trim(bvmo.org),''),&

我看过其他一些关于此的帖子，但没有找到永久有效的答案。我们有一张表，我不得不向它添加两

我有一个 10 TB 大小的表，它有 2k+ 个分区，每个分区有大约 300 个小文件，你能帮我解决小文件问题而

我在使用 Kerberos 设置集成身份验证以将 Impala Db 与 Jboss wildfly 10 上的数据源连接时遇到问题。这是我的

我有这个查询： <pre><code>select id,name,surname from db.table where id_date = 20201101 </code></pre> 但是我想如果这

我有两列如下： <pre><code>a_user_id b_user_id 45610123 456 567232436 567 </code></pre> 表示 a_user_id 是 some_num

我在 Impala 中有一个表格，其中每秒都有数据。我想每 5 分钟后获得一次数据。给定表： <pre><code>Time

我正在尝试使用 pyodbc 和 Cloudera ODBC 驱动程序为 Impala 执行参数化插入查询，但它不起作用。我正在尝试

我正在运行 Impala 查询并尝试使用 case when 语句： <pre class="lang-sql prettyprint-override"><code>SELECT *, CASE WHEN

<pre><code>create table db.temp location '/user/temp' as SELECT t1.mobile_no FROM db.temp t1 WHERE NOT EXISTS ( SELECT NULL

我在子查询中运行排名函数，结果集中排除了 Null 值。问题似乎与以下事实有关：查询作为子查询

我正在尝试理解 Query 中必须由 Impala 改编的小片段。 <pre><code>Select . . from ${ENV_PREFIX}private_datalap_storag

我可以在一个段落中设置用户输入的 Zeppelin 注释，在其他段落中设置不同的 SQL 查询（与 Impala 一起运行

我需要使用 Zeppelin 来运行一些使用 Impala 的大数据查询，但还需要添加一些小的处理（例如使用 Python）

我有一个用例，如果某个特定服务在某个节点上关闭，则不应再在那里安排任何作业。对于 Hive 或 Spark

如何在 Zeppelin 中实现条件分支？例如 <pre><code>IF <condition> THEN <run paragraph A> ELSE <run p

我首先使用 <code>pyspark</code> 将数据插入到一个空表中，但随后我将不得不自动化该过程。使用 <code>pyspar

根据我的项目要求，我提出了一个复杂的逻辑，其中包含如下“一小部分”： <pre><code> 'regexp_ext