hadoop详细安装与配置

Hadoop安装与配置(两个节点master,slave)

  1. 安装VM virtulBox软件(用于创建虚拟机)

链接: https://www.virtualbox.org/wiki/Downloads

选择你要下载的VM virtulBox虚拟机

在这里插入图片描述


2. 下载镜像文件用于加载虚拟机
----可以选择国内的一些镜像网站–清华大学镜像网站
百度网盘
链接:https://pan.baidu.com/s/1x9IHwEmx9t2g7M3CDybxzA
提取码:xong
3.进行一系列软件安装(不在赘述…)
4.创建虚拟机(此处我已经创建了了):master
-点击新建
-名称
-位置(尽量选择较大的盘)
-类型:Linux
-版本:ubuntu(64)

在这里插入图片描述


然后分配内存根据你的电脑配置适当分配即可

在这里插入图片描述


选项保持不变即可

在这里插入图片描述


在这里插入图片描述


稍微分配多点,因为是动态分配的,避免以后因为硬盘存储不够而重装ubuntu

在这里插入图片描述


最终创建成功(第二个节点可以先不用创建,可以在master节点配置完成后进行复制)

在这里插入图片描述

点击启动
-选择语言
-点击安装
-按照指示进行安装即可(此过程较慢请耐心等待…)

在这里插入图片描述


4. 复制虚拟机slave节点(注意更改ip地址,不然会造成连接不通的错误)
–记着对slave节点进行改名
-再打开slave节点

在这里插入图片描述


结束启动即可

起始工作创建用户,建立ssh连接,下载jdk.

  1. Hadoop在Ubuntu环境下的部署可以细分为以下五个部分,分别为:虚拟机网络配置、Java环境配置、SSH配置、Hadoop安装配置以及Hadoop的启动停止。
  2. 先创建一个hadoop用户以便后面使用。
  • sudo useradd -m hadoop -s /bin/bash
  • sudo passwd hadoop // 为"hadoop"用户设置密码;
  • sudo adduser hadoop sudo //为"hadoop"用户添加管理员权限;
  • 注销当前用户,使用"hadoop"用户登录。
  1. 虚拟机网络配置
    -首先我们需要在Ubuntu安装net工具,执行 sudo apt install net-tools,之后可以使用ifconfig命令,查看当前节点的网络网卡信息;进入终端(注意切换到桥接模式)

    在这里插入图片描述


    在这里插入图片描述


    在slave节点也是如此。
    -使用ifconfig前需更新一下 sudo apt install net-tools

    在这里插入图片描述

  2. 更新和安装apt,vim编辑器。
    -sudo apt-get update
    -sudo apt-get install vim

  3. 安装SSH和配置SSH无密码登录。
    -先进行master和slave互通
    -sudo vim /etc/hosts
    -master和slave都需配置

    在这里插入图片描述

  4. 检验是否连接成功利用ping master或ping slave分别在不同的虚拟机上。

    在这里插入图片描述


    在这里插入图片描述


    8.安装jdk
    -在oracle官网下载jdk1.8.xx(账号密码可以在csdn上直接搜索即可有共享的)
    -以上准备完成后

  5. 进入终端
    -创建一个文件夹`
    -并将jdk安装包解压到你创建文件的位置

    在这里插入图片描述


    -配置jdk文件

    在这里插入图片描述


    -写入命令source ~/.bashrc使配置文件生效
    最后检查是否成功java -version

    在这里插入图片描述

  6. 进行ssh免密登录操作
    -下载sudo apt-get install openssh-server
    出现问题

    在这里插入图片描述


    -可以利用命令(如果出现不同的原因可以直接复制出错的原因在网上搜索)

    在这里插入图片描述

    -再次尝试

    在这里插入图片描述

  7. ssh localhost实现本地登录

    在这里插入图片描述


    最后利用命令exit退出ssh

  8. ssh密钥生成,进入后一路回车即可
    -rm ./id_rsa* //删除以前产生的密钥

    在这里插入图片描述

  9. 密钥传输(注意两个虚拟机都应开着)
    -cat ./id_rsa.pub >> ./authorized_keys //将公钥放到autiorized_keys中

    在这里插入图片描述

    如果一个虚拟机没开则会出现

    在这里插入图片描述


    -scp ~/.ssh/id_rsa.pub hadoop@slave03:/home/hadoop //将master节点到公钥复制到slave节点中

在这里插入图片描述


-可以查看是否传输成功—进入slave节点的目录下

在这里插入图片描述


12. .此时在slave节点虚拟机上操作
-输入mkdir ~/.ssh
-cat ~/id_rsa.pub >> ~/.ssh/authorized_keys //密钥加入到slave节点
-rm ~/id_rsa.pub //删除密钥文件
13. .回到master节点在终端进行测试

在这里插入图片描述

hadoop安装与配置

  1. 下载安装包在国内镜像网站https://mirrors.tuna.tsinghua.edu.cn/apache/Hadoop/common/Hadoop-3.3.1
  2. sudo tar -zxf~/download/hadoop-3.3.1.tar.gz -C /usr/lcoal //将Hadoop解压到/usr/lcoal下
    cd /usr/local
    sudo mv ./hadoop-3.3.1 ./hadoop //修改文件名为hadoop
    sudo chown -R hadoop ./hadoop //修改文件权限

    在这里插入图片描述

  3. 配置Hadoop文件
    -sudo vim ~/.bashrc
    export HADOOP_HOME=/usr/local/hadoop
    export HADOOP_MAPRED_HOME= H A D O O P H O M E e x p o r t H A D O O P C O M M O N H O M E = HADOOP_HOME export HADOOP_COMMON_HOME= HADOOPHOMEexportHADOOPCOMMONHOME=HADOOP_HOME
    export HADOOP_HDFS_HOME= H A D O O P H O M E e x p o r t Y A R N H O M E = HADOOP_HOME export YARN_HOME= HADOOPHOMEexportYARNHOME=HADOOP_HOME
    export HADOOP_COMMON_LIB_NATIVE_DIR= H A D O O P H O M E / l i n / n a t i v e e x p o r t P A T H = {HADOOP_HOME}/lin/native export PATH= HADOOPHOME/lin/nativeexportPATH={JAVA_HOME}/bin: H A D O O P H O M E / b i n : {HADOOP_HOME}/bin: HADOOPHOME/bin:{HADOOP_HOME}/sbin:$PATH
    -配置后需生效source ~/.bashrc

    在这里插入图片描述


    版本信息

    在这里插入图片描述

  4. 在usr/local/Hadoop/etc/hadoop目录下配置
    -sudo vim core-site.xml


    fs.defaultFS
    hdfs://master:9000


    io.file.buffer.size
    131072


    hadoop.tmp.dir
    file:/usr/local/hadoop/tmp
    Abasefor other temporary directories.


    hadoop.proxyuser.spark.hosts



    hadoop.proxyuser.spark.groups



    在这里插入图片描述


    hdfs-site.xml


    dfs.namenode.secondary.http-address
    master:9001


    dfs.namenode.name.dir
    file:/usr/local/hadoop/dfs/name


    dfs.datanode.data.dir
    file:/usr/local/hadoop/dfs/data


    dfs.replication
    1(因为配置的为1个节点所以写1)


    dfs.webhdfs.enabled
    true

在这里插入图片描述


yarn-site.xml


yarn.nodemanager.aux-services
mapreduce_shuffle


yarn.nodemanager.aux-services.mapreduce.shuffle.class
org.apache.hadoop.mapred.ShuffleHandler


yarn.resourcemanager.address
master:8032


yarn.resourcemanager.scheduler.address
master:8030


yarn.resourcemanager.resource-tracker.address
master:8035


yarn.resourcemanager.admin.address
master:8033


yarn.resourcemanager.webapp.address
master:8088


在这里插入图片描述


mapred-site.xml不同的版本可能有mapred-site.xml.template
可以重命名cp mapred-site.xml.template mapred-site.xml


mapreduce.framework.name
yarn


mapreduce.jobhistory.address
master:10020


mapreduce.jobhistory.webapp.address
master:19888


在这里插入图片描述


6. 注意修改workers文件有的版本可能有不同的利用ls 查看。
-修改文件—localhost改为 你的另一个节点名称slave(如果有两个则写两个)

在这里插入图片描述

两节点传输安装包

  1. 将master节点的hadoop文件进行压缩到主目录下(将master节点的安装包传到slave节点)

    在这里插入图片描述


    -将压缩的hadoop压缩包传输到slave节点

    在这里插入图片描述

  2. 转到slave节点进行解压文件

    在这里插入图片描述

  3. 查看hadoop版本

    在这里插入图片描述

  4. hadoop启动
    -先进行初始化-在/usr/local/Hadoop 目录下 ./bin/hdfs namenode -format

    在这里插入图片描述


    (如果你运行过后面Hadoop启动时有错误记得删除tmp文件下的所有文件,防止再次启动时不显示datanode)
    -启动start-dfs.sh

    在这里插入图片描述


    -start-yarn.sh

    在这里插入图片描述


    -4.查看slave节点jps状态

    在这里插入图片描述


    -5.输入http://localhost:9870 显示(前提hadoop启动)

    在这里插入图片描述

可能出现的错误

1.错误一

在这里插入图片描述


用于2022-07-29 …
可以直接在文件中找/usr/local/hadoop/etc/hadoop/log4j.properties文件加上一句
log4j.logger.org.apache.hadoop.util.NativeCodeLoader=ERROR
(注:此错误可以忽略)
2. 错误2

在这里插入图片描述


注意你的虚拟机连接模式(桥接模式)
3.如果还是启动不了—注意你的Hadoop配置文件(两个节点都需要查看)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
Can’t connect to local MySQL server through socket \'/var/lib/mysql/mysql.sock问题 1.进入mysql路径
oracle基本命令 一、登录操作 1.管理员登录 # 管理员登录 sqlplus / as sysdba 2.普通用户登录
一、背景 因为项目中需要通北京网络,所以需要连vpn,但是服务器有时候会断掉,所以写个shell脚本每五分钟去判断是否连接,于是就有下面的shell脚本。
BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。
假如你已经使用过苹果开发者中心上架app,你肯定知道在苹果开发者中心的web界面,无法直接提交ipa文件,而是需要使用第三方工具,将ipa文件上传到构建版本,开...
下面的 SQL 语句指定了两个别名,一个是 name 列的别名,一个是 country 列的别名。**提示:**如果列名称包含空格,要求使用双引号或方括号:
在使用H5混合开发的app打包后,需要将ipa文件上传到appstore进行发布,就需要去苹果开发者中心进行发布。​
+----+--------------+---------------------------+-------+---------+
数组的声明并不是声明一个个单独的变量,比如 number0、number1、...、number99,而是声明一个数组变量,比如 numbers,然后使用 nu...
第一步:到appuploader官网下载辅助工具和iCloud驱动,使用前面创建的AppID登录。
如需删除表中的列,请使用下面的语法(请注意,某些数据库系统不允许这种在数据库表中删除列的方式):
前不久在制作win11pe,制作了一版,1.26GB,太大了,不满意,想再裁剪下,发现这次dism mount正常,commit或discard巨慢,以前都很快...
赛门铁克各个版本概览:https://knowledge.broadcom.com/external/article?legacyId=tech163829
实测Python 3.6.6用pip 21.3.1,再高就报错了,Python 3.10.7用pip 22.3.1是可以的
Broadcom Corporation (博通公司,股票代号AVGO)是全球领先的有线和无线通信半导体公司。其产品实现向家庭、 办公室和移动环境以及在这些环境...
发现个问题,server2016上安装了c4d这些版本,低版本的正常显示窗格,但红色圈出的高版本c4d打开后不显示窗格,
TAT:https://cloud.tencent.com/document/product/1340