hdfs - 编程之家

我们在内部登台节点中配置了一个端点为<code>http://10.91.16.213:8080</code>的雪球。一切正常，我什至可以通

我正在遵循<a href="https://stackoverflow.com/questions/25989187/unable-to-create-table-in-hive-reading-a-csv-from-hdfs">this</a>解

使用： HDP 3.0.1 HDFS 3.1.0 Apache Ambari版本2.7.1.0 <a href="https://i.stack.imgur.com/SiEQm.png

我在YARN上运行Spark。 hadoop的版本是3.1.1，spark的版本是2.3.2。 hadoop集群有3个节点。我由用户A提交jo

我创建一个像这样的数据框： <pre><code>val df = Seq( (1,27,"bob",2020,9,3), (1,27,"jack",2020,9,3),

由于某些运行时异常，Mapper Jobs正在停止。基本要点是csv文件中的日期格式为'dd-Mon-yy'，与MySql的'yyyy-mm-dd

感谢您调查我的问题。我很感激。所以我是该领域的新手...但是我正在考虑用S3替换当前使用的Hado

我正在尝试使用<a href="https://stackoverflow.com/a/19553790/1346528">answer</a>中建议的<code>ContentSummary.getSpaceConsumed</

配置单元外部和托管表的优缺点是什么？我们想在Hive表中进行更新和插入，但是想知道采用哪种

我有一个应用程序，它将从namenode获取文件的块位置。我找到了一种通过RPC api连接到namenode的方法，如下

格式化名称节点时出现以下错误。请让我知道可能是什么原因以及如何解决这个问题？ <pre><code>Invocat

我有一个Oozie工作流程，其中包含一个Pig动作，生成一个零件文件作为输出 <code>/user/wf_user/app_dir/ou

我无法让Hadoop dfs作为Ubuntu18.04上的系统服务运行。从终端运行start-dfs.sh可以正常运行，但是作为systemd服

我刚接触过HIVE，这是我的第一次尝试这是我的数据示例 <blockquote> 年龄；“工作”；“婚姻

我想使用命令 <code>hadoop fs -put</code> 将一个大文件上传到 hadoop 环境。请问<code>put</code>能保证这个文件

我有 2 个 java 函数： <code>listeFilesHdfs</code> 返回存储在 HDFS 中的文件列表，例如：如果您备注，HDFS

我正在运行配置单元外部表查询。 <strong>问题：</strong> 蜂巢显示的“ <code>Select * from table1</code>”行计数

我有一个Spark应用程序，它从hdfs中获取数据并将数据提取到S3中。以下是我正在使用的不同组件的版本。

我有一个结构如下的Java对象： <pre><code>public class Example{ private String key; private Object value; getters an

我们有生产HDP集群， <pre><code>HDP version - 2.6.5 Ambari version - 2.6.1 </code></pre> 我们现在正在根据文档-<a