白话--基于Centos7.8的CDH6.2.1大数据集群环境搭建

目录

前言

Cloudera’s Distribution Including Apache Hadoop介绍和背景

安装包准备

安装

Cloudera Manager使用


前言

因为面试受挫,因此起了杀心,不是起了玩大数据的心思;但是巧妇难为无米之炊,因此自己在win10+32RAM的基础上搭建一个大数据集群,此文章只为记录,各位看官有问题及时沟通。

Cloudera’s Distribution Including Apache Hadoop介绍和背景

Cloudera’s Distribution Including Apache Hadoop介绍和背景的话,姥爷们请www.baidu.com就可以出来了,不信您试试.

安装包准备

安装包(cdh7.8-6.2.1+mysql5.6+jdbc+jdk1.8)我已经打包好一份儿,很安全,很便利的;

链接:https://pan.baidu.com/s/1KNGg-UJQEZb58VKZ31acIQ  提取码:didp

虚拟机器准备

个人建议可以在一个虚拟机上配置一些共性属性,然后使用VM进行完整克隆就可以了,省事儿;综上,在hadoop1上配置:hostname, hosts, jdk,IP,防火墙,IPv6,SELlinux,THP,swappiness,NTP,时区和系统语言后可以克隆了;

安装包上传/下载使用winscp,舒坦;

安装

hostname+JDK+IP+hosts+防火墙+免密登录方法:https://blog.csdn.net/weixin_40039499/article/details/88682571

禁用IPv6:

vi etc/sysconfig/network
insert:
NETWORKING_IPV6=no
vi /etc/sysctl.conf
insert:
net.ipv6.conf.all.disable_ipv6=1
vi /etc/sysconfig/network-scripts/ifcfg-eno****
replace:
IPV6INIT=no

关闭SELinux:

检查SELinux状态
# getenforce
输出是enforcing,则继续以下步骤,否则进行下一步
# vi /etc/sysconfig/selinux
修改SELINUX=enforcing 为 SELINUX=permissive

修改完成后,重启或是执行以下命令立即关闭SELinux
# setenforce 0

关闭THP:

首先检查THP的启用状态:
cat /sys/kernel/mm/transparent_hugepage/defrag
[always] madvise never
cat /sys/kernel/mm/transparent_hugepage/enabled
[always] madvise never
输出如上则是启用的。

修改
# vi /etc/rc.local
在最后添加如下内容:
echo never > /sys/kernel/mm/transparent_hugepage/enabled
echo never > /sys/kernel/mm/transparent_hugepage/defrag

修改完成后,赋予rc.local文件执行权限
# chmod +x /etc/rc.local

重启后检查是否生效

修改swappiness(内存越大,值越小):

Swappiness是swap与内存的比例,centos7的默认值是60
临时修改
# sysctl -w vm.swappiness=10
永久修改
# echo "vm.swappiness=10" >> /etc/sysctl.conf

配置NTP:

安装NTP
yum install ntp
vi /etc/ntp.conf

在主节点上
# vi /etc/ntp.conf
注释掉原来的server 0.centos.pool.ntp.org.iburst
注释掉原来的server 1.centos.pool.ntp.org.iburst
注释掉原来的server 2.centos.pool.ntp.org.iburst
注释掉原来的server 3.centos.pool.ntp.org.iburst
插入:
restrict 192.168.*.* nomodify notrap nopeer noquery
restrict 192.168.*.2 mask 255.255.255.0 nomodify notrap

server 127.127.1.0
fudge  127.127.1.0 stratum 10

在其他节点上
# vi /etc/ntp.conf
注释掉原来的server 0.centos.pool.ntp.org.iburst
注释掉原来的server 1.centos.pool.ntp.org.iburst
注释掉原来的server 2.centos.pool.ntp.org.iburst
注释掉原来的server 3.centos.pool.ntp.org.iburst
插入:
server hadoop1
fudge  hadoop1 stratum 10

在所有节点上
启动ntp服务
systemctl start ntpd
设置开机启动ntp服务
systemctl enable ntpd
验证ntp服务是否开启
ntpq -p
验证时间是否同步
ntpstat
同步应显示: synchronised balabalabalabala
未同步则显示: unsynchronised balabalabalabala
同步比较慢,服务器动手,抽个烟,喝个茶再来看吧

修改时区和系统语言,这里直接附代码:

查看时区
# timedatectl
修改时区
# cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
查看OS系统语言
# echo $LANG
修改OS系统语言
# vi /etc/profile
在最后添加
export LANG=” en_US.UTF-8”

个人建议可以在一个虚拟机上配置一些共性属性,然后使用VM进行完整克隆就可以了,省事儿;综上,在hadoop1上配置:hostname, hosts, jdk,IP,防火墙,IPv6,SELlinux,THP,swappiness,NTP,时区和系统语言后可以克隆了;对hadoop2, hadoop3进行hostname,IP修改就好了

*****************************************************以下操作全是在hadoop1上********************************

在hadoop1上安装Mysql: https://blog.csdn.net/weixin_40039499/article/details/88837548

将mysql-connector-java-5.1.46.jar包重命名为:mysql-connector-java.ja放置在每一个节点的:/usr/share/java/下

为CDH创建metadata库:

创建数据库及用户(root用户在mysql命令行下执行)
CREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON scm.* TO 'scm'@'%' IDENTIFIED BY 'scm';

CREATE DATABASE amon DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON amon.* TO 'amon'@'%' IDENTIFIED BY 'amon';

CREATE DATABASE rman DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON rman.* TO 'rman'@'%' IDENTIFIED BY 'rman';

CREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON hue.* TO 'hue'@'%' IDENTIFIED BY 'hue';

CREATE DATABASE metastore DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON metastore.* TO 'hive'@'%' IDENTIFIED BY 'hive';

CREATE DATABASE sentry DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON sentry.* TO 'sentry'@'%' IDENTIFIED BY 'sentry';

CREATE DATABASE nav DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON nav.* TO 'nav'@'%' IDENTIFIED BY 'nav';

CREATE DATABASE navms DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON navms.* TO 'navms'@'%' IDENTIFIED BY 'navms';

CREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON oozie.* TO 'oozie'@'%' IDENTIFIED BY 'oozie';

设置yum本地源(联网):

安装: yum install httpd
启动: service httpd start
开机启动: chkconfig httpd on
测试http是否成功
在ie中输入地址http://192.168.131.129/

将CDH安装文件放置在相应目录: /var/www/html/cm  /var/www/html/cdh

在浏览器中输入地址 http://192.168.131.129/cm/  可以访问文件就OK

在 /var/www/html/cm中执行createrepo命令创建本地仓库

# 安装createrepo命令
yum install createrepo
# 在cm目录下执行命令
createrepo .

# 如果不想使用本地仓库,可以删除一下文件
cd /etc/yum.repo/
# rm -rf 自建的repo文件
如:rm -rf cm.repo

制作cm的repo源:

vim /etc/yum.repos.d/cm.repo
insert:

[cmrepo]
name = cm_repo
baseurl = http://hadoop1/cm
enable = true
gpgcheck = false

完成后执行:yum repolist
目的是查看创建仓库是否成功;在返回的列表中找到创建的仓库即可;
看到successful, 恭喜你  下一步va

yum repolist返回结果如图:

安装CM: yum install cloudera-manager-daemons cloudera-manager-server -y

配置CM的metadata: ./opt/cloudera/cm/schema/scm_prepare_database.sh mysql scm scm scm

如果配置过程中报错:

    1. 将jdbc.jar拷贝到/usr/share/java/目录下,执行上面的命令

    2. 使用root登录mysql数据库将user为null的数据删除,重启数据库,执行上面的命令

启动cm服务

# sudo systemctl start cloudera-scm-server

等待几分钟,为了观察启动进程,可以执行以下命令

# sudo tail -f /var/log/cloudera-scm-server/cloudera-scm-server.log

出现以下内容时:INFO WebServerImpl:com.cloudera.server.cmf.WebServerImpl: Started Jetty server. 启动成功

浏览器访问:http://192.168.131.129:7180 默认账号为 admin / admin

Cloudera Manager使用

安装CDH:

tips:AUTO-TLS,集群加密访问,也就是https,这里跳过,点击继续

查找主机时输入:hadoop[1-3],就可以查到3台机器了

选择存储库时:自定义存储库输入地址:http://hadoop1/cm

CDH and other software 根据建议选择更过选项:配置远程URL:http://hadoop1/cdh 其他连接点减号去掉就行

oracle JDK的跳过直接进行下一步

提供SSH登陆凭据:输入密码就可以 

然后就会安装agent 和 Parcel了  趁这会去撩妹吧

傻瓜式选择,干就完了;

好了撩妹结束,不对是安装结束,选择需要的大数据组件安装就行了,人家会有推荐的套餐,很合理的,安装就行了;

有警告的话,忽略,有问题,百度,好了去试试吧

结语:

       我爱的人,不是我的爱人

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读903次。4.清除缓存目录(/var/cache/yum)下的软件包及旧的headers。11.列出所有已安裝但不在 Yum Repository 內的软件包信息。3.清除缓存目录(/var/cache/yum)下旧的 headers。2.清除缓存目录(/var/cache/yum)下的 headers。5.列出所有已安装但不在 Yum Repository 內的软件包。1.清除缓存目录(/var/cache/yum)下的软件包。9.列出所有可更新的软件包信息。3.列出所有可更新的软件包。_centos yum update
文章浏览阅读1.5k次。Python 是一种高级解释性编程语言,已被用于各种应用程序开发,并在近年来获得了巨大的流行。Python 可用于编写广泛的应用程序,包括 Web 开发、数据分析、科学计算、人工智能、游戏等。由于其简单易用,它是初学者的理想语言。Python广泛应用于金融、医疗保健和科技等行业,并且由于其丰富的数据分析和可视化库和工具集而受到数据科学家和研究人员的欢迎。创建本内容时 Python 的最新稳定版本是 Python 3.11。_linux安装python3.11
文章浏览阅读2.6k次。打开终端或控制台,以root或具有sudo权限的用户身份登录。根据你的Linux发行版和网络管理工具的不同,相应的命令可能略有不同。使用以下命令编辑网络配置文件,例如eth0网卡的配置文件:注意:ifcfg-eth0 可能会有不同的命名,根据实机情况确认。在编辑器中,找到以"IPADDR"开头的行,然后修改IP地址。例如,将IP地址更改为192.168.1.100_银河麒麟修改ip地址
文章浏览阅读744次,点赞24次,收藏26次。目标:通过AppSrv为InsideCli客户端网络分配地址,地址池范围:192.168.0.110-192.168.0.190/24。另外一个虚拟网卡改为192.168.0.1给Rserver服务器,添加多一个网卡,用于连接不同的网段分别选刚才选好的两个网段之后,开启各虚拟机,配置IP地址ip addr查看网卡vi /etc/sysconfig/network-scripts/ifcfg-ens33新网卡没有UUID,要生成一个uuidgen然后记下进入文件夹cd /etc/sysconfig/netwo
文章浏览阅读1.1w次,点赞8次,收藏26次。chmod命令来自于英文词组“change mode”的缩写,其功能适用于改变文件或者目录权限的命令。默认只有文件的所有者和管理员可以设置文件权限,普通用户只能管理自己的文件的权限属性。设置权限时可以使用数字法,亦可使用字母表达式,对于目录文件建议加入-R参数进行递归操作,意味着不仅对于目录本身,也对目录内的子文件/目录进行新权限的设定。_chmod修改权限
文章浏览阅读1.2k次。yum源的URL地址,本例中是文件系统的路径,以“file:///”开头。其中,是要安装的软件包的名称。:本节的名称,可以是任何名称,但是必须以“[ ]”括起来。如果能够看到光盘的设备信息,则说明系统已经检测到了光盘。注意:baseurl的值必须是光盘挂载的目录路径。:GPG公钥文件的路径,用于yum包的安全性检查。:yum源是否启用,1表示启用,0表示禁用。:是否进行GPG校验,1表示是,0表示否。打开终端,使用root用户登录。:yum源的名称,可以自定义。_centos挂载光盘
文章浏览阅读1.4k次。这会在系统中安装新的 OpenSSL 版本。如果输出结果中的版本号为 1.1.1 或更高版本,则说明 OpenSSL 已成功升级。然后将新安装的OpenSSL做软连接到这个路径。4.初始化并编译、安装。_centos 升级 openssl
文章浏览阅读4.9k次,点赞5次,收藏11次。[Linux下的软连接、软链接的方式]][[Linux使用的filesystem库来自于c++17提供的新特性]][[Linux下centos查看 GCC 、G++版本]][[Linux 下centos 查看 -std 是否支持 C17 ]]_gcc c++17
文章浏览阅读3.2k次,点赞3次,收藏9次。Linux (centos) 安装Python3.9(保姆级别)_centos安装python3.9
文章浏览阅读5.9k次,点赞4次,收藏4次。进入国内的阿里云的,这里CentOS 7提供了三种ISO镜像文件的下载:DVD ISO、Everything ISO、Minimal ISO。阿里云下载链接: http://mirrors.aliyun.com/centos/点击进入下载页面,随便选择一个下载即可(不推荐,推荐阿里云下载,见下文)阿里云下载站点(速度非常快推荐)_centos7 iso
文章浏览阅读3.9k次。运行报错_inconsistency detected by ld.so: dl-call-libc-early-init.c: 37: _dl_call_lib
文章浏览阅读782次,点赞22次,收藏24次。通过查看INSTALL文件我们可以知道安装glibc2.31的要求,需要binutils版本2.25以上,texinfo版本4.7以上,bison版本2.7以上,sed版本3.02以上,gettext0.10.36以上,Python3.4以上,GDB7.8以上,make版本4.0以上,GCC版本6.2 以上。isl-0.18版本: http://www.mirrorservice.org/sites/sourceware.org/pub/gcc/infrastructure。_rpm 更新glibc2.31
文章浏览阅读905次,点赞19次,收藏16次。操作系统运维相关操作,实用而全面_centos 共享磁盘
文章浏览阅读1.5k次。CentOS Stream的位置提到RHEL上游,解决了“孤儿”的问题。红帽在RHEL上开发的所有功能都已经在CentOS Stream上完成,生态伙伴所添加的内容都将返回到CentOS Stream中,这些新功能会在未来RHEL发布出来,避免了生态伙伴创新消失不见情况的发生,从而保护投资,保护创新。为什么强调位置的变化?红帽的创新得到了CentOS创造者Gregory Kurtzer的肯定,他曾在公开场合表示,红帽做了正确的事情,CentOS Stream的场景比CentOS更好,更适合社区的发展。_dnf: command not found
文章浏览阅读1k次,点赞3次,收藏6次。sysconf:keepalived核心配置文件所在位置,固定位置,改成其他位置则keepalived启动不了,/var/log/messages中会报错。注意:如果在第5步执行 make && make install 时,报如下错误,则可能是keepalived版本号不对,可以试试 2.1.0 以前的版本。4. 进入到解压后的文件夹内,里面会看到 configure 文件,接下来就可以使用 configure 命令进行配置了。2. 通过 ftp工具上传到 linux:/home/software/_服务器双机热备
文章浏览阅读3k次。配置iptables规则,限制用户的出口IP,这里是根据用户的uid去限制的,比如user001用户的uid是1000,配置user001用户的出口IP就是172.17.22.1,以下是示例,根据自己情况修改uid和出口IP。找到auth的配置,默认是注释了的,先放开注释(就是把首行的#去掉),然后把Authentication这列改为u,以下是修改后的截图。打开后是空文件,在这里面添加自己的代理账号和密码,格式:账号+英文空格+密码,以下是例子,自己配置自己的账号。至此恭喜你,完成了所有配置!_站群搭建socks5
文章浏览阅读815次。下载链接:https://github.com/PowerShell/PowerShell/releases。下载链接:https://github.com/PowerShell/PowerShell/_linux中pwsh安装
文章浏览阅读877次,点赞10次,收藏5次。在CentOS系统中,Apache服务器是一个常用的Web服务器软件,它可以高效地提供静态HTTP服务。现在,您已经成功地在CentOS系统中配置了Apache服务器提供静态HTTP服务。启用默认站点:确保在配置文件中启用了默认的站点配置。此外,根据您的需求,您可能还需要进一步配置Apache的其他功能和模块。在配置文件中,您可以进行各种设置以定义您的静态HTTP服务的行为。指令,以定义适当的权限和设置。例如,确保目录的权限设置为适当的读/写/执行权限。指令设置为包含您的静态文件的目录路径。_centos还能用服务器吗
文章浏览阅读676次,点赞71次,收藏64次。简单几步实现在Linux centos环境下安装部署sql server数据库,并结合cpolar内网穿透工具,创建安全隧道将其映射到公网上,获取公网地址,实现在外异地远程连接家里/公司的sqlserver数据库,而无需公网IP,无需设置路由器,亦无需云服务器。
文章浏览阅读5.5k次。在 CentOS 7 中,可以通过以下步骤来开放指定端口号:1、使用 root 或具有管理员权限的用户登录到 CentOS 7 服务器。2、使用防火墙管理工具 firewalld 进行端口开放。 firewalld 是 CentOS 7 默认的防火墙管理工具。3、检查当前防火墙的状态,确保 firewalld 服务已经运行并且正常工作。可以使用以下命令来检查:_centos7开放端口