impala专题提供impala的最新资讯内容,帮你更好的了解impala。
我有下表, <div class="s-table-container"> <table class="s-table"> <头> <tr> <th>用户 ID</th> <th>siteId</th> <th>logged_time
我们有一个使用impala jdbc 连接运行少量SQL 的spark 应用程序。应用程序在不同的时间完成,如 15 分钟、1
<pre><code>select case when concat(&#39;ACC&#39;,&#39;-&#39;,NVL(trim(bvmo.booking),&#39;&#39;),&#39;-&#39;,NVL(trim(bvmo.org),&#39;&#39;),&
我看过其他一些关于此的帖子,但没有找到永久有效的答案。 我们有一张表,我不得不向它添加两
我有一个 10 TB 大小的表,它有 2k+ 个分区,每个分区有大约 300 个小文件, 你能帮我解决小文件问题而
我在使用 Kerberos 设置集成身份验证以将 Impala Db 与 Jboss wildfly 10 上的数据源连接时遇到问题。 这是我的
我有这个查询: <pre><code>select id,name,surname from db.table where id_date = 20201101 </code></pre> 但是我想如果这
我有两列如下: <pre><code>a_user_id b_user_id 45610123 456 567232436 567 </code></pre> 表示 a_user_id 是 some_num
我在 Impala 中有一个表格,其中每秒都有数据。我想每 5 分钟后获得一次数据。给定表: <pre><code>Time
我正在尝试使用 pyodbc 和 Cloudera ODBC 驱动程序为 Impala 执行参数化插入查询,但它不起作用。 我正在尝试
我正在运行 Impala 查询并尝试使用 case when 语句: <pre class="lang-sql prettyprint-override"><code>SELECT *, CASE WHEN
<pre><code>create table db.temp location &#39;/user/temp&#39; as SELECT t1.mobile_no FROM db.temp t1 WHERE NOT EXISTS ( SELECT NULL
我在子查询中运行排名函数,结果集中排除了 Null 值。 问题似乎与以下事实有关:查询作为子查询
我正在尝试理解 Query 中必须由 Impala 改编的小片段。 <pre><code>Select . . from ${ENV_PREFIX}private_datalap_storag
我可以在一个段落中设置用户输入的 Zeppelin 注释,在其他段落中设置不同的 SQL 查询(与 Impala 一起运行
我需要使用 Zeppelin 来运行一些使用 Impala 的大数据查询,但还需要添加一些小的处理(例如使用 Python)
我有一个用例,如果某个特定服务在某个节点上关闭,则不应再在那里安排任何作业。对于 Hive 或 Spark
如何在 Zeppelin 中实现条件分支? 例如 <pre><code>IF &lt;condition&gt; THEN &lt;run paragraph A&gt; ELSE &lt;run p
我首先使用 <code>pyspark</code> 将数据插入到一个空表中,但随后我将不得不自动化该过程。使用 <code>pyspar
根据我的项目要求,我提出了一个复杂的逻辑,其中包含如下“一小部分”: <pre><code> &#39;regexp_ext