Hadoop - 编程之家

全部我是Hadoop的新手。在docker中构建具有5个节点的Hadoop集群后，无法关闭namenode安全模式。我尝

第一篇文章！我正在尝试使用带有HADOOP和Yarn的mapreduce运行WordCount程序，但出现此错误： <blockquote>

我想将文件上传到Apache Ozone。我使用<code>FileSystem</code>界面。 Java代码如下 <strong> java代码：</strong>

我看过<a href="https://stackoverflow.com/questions/22906226/how-do-i-search-for-an-item-in-an-array-in-hive">this</a>，但是它对

<pre><code>2020-08-17 22:47:16,761 INFO org.apache.hadoop.hdfs.server.namenode.NameNode: STARTUP_MSG: STARTUP_MSG: Starting NameNode START

我正在做一个具有深度学习的汽车股票交易系统项目我有股票市场的API，想与Hadoop集群连接可以将API与

我们已经创建了Bigdata POC，并使用Angular创建了UI。现在我们要通过Angular应用程序将文件上传到HDFS，我们

几乎在所有地方都进行了检查，这个问题似乎仍然存在。 <pre><code><configuration> <property> <n

我有一个按日期分区的配置单元表。我有日期“ 2020-08-18”的数据。我想将相同的数据复制（复制）到另

在相当新的环境中挖掘POC以获取火花并检查火花功能，但是在pyspark终端中运行sql查询时出现问题，而Hive

几乎在所有地方都进行了检查，这个问题似乎仍然存在。 <pre><code><configuration> <property> <n

由于我们已从CDH迁移到HDP（火花2.2到2.3），因此我遇到了一些数据删除问题。正在从hdfs位置读取表，并

我是Spark的新手。任何帮助将不胜感激。 Spark SQL中是否可以使用sql的<code>FORMAT()</code>替代方法。我的核

小文件和HDFS出现问题。场景：我正在使用NiFi读取来自Kafka主题的消息，这些消息确实很小。

我有两个具有相同列名的文件。我通过读取这些<code>CSV</code>文件创建了两个数据帧。考虑一个名为<code>U

我有一个蜂巢表 <pre><code>col1 col2 1 ["apple", "orange"] 1 ["orange", "banana"] 1

我已经对Hadoop集群进行了内核化，除了Hive Server2之外，所有组件都运行良好。 hive.log显示以下错误：

我正在尝试在postgres上创建一个外部配置单元表。根据以下主题中的答案，我的第一个错误已解决： <a h

SELECT user_id，总和（区分大小写当click_date在“ 2020-08-01”和“ 2020-07-25”之间时然后1 ELSE NULL END）total_

我使用ambari管理纱线簇， <a href="https://i.stack.imgur.com/zd7XQ.jpg" rel="nofollow noreferrer"><img src="https://i.sta