hive单节点安装

一，基础环境安装准备
1.修改主机名
hostnamectl set-hostname hadoop (Ctrl+D重新连接)
2.关闭防火墙
systemctl stop firewalld
systemctl disable firewalld
3.修改hosts文件
vi /etc/hosts

192.168.200.2 hadoop

二，安装jdk
1.新建tgz目录，（将安装包放入创建的tgz目录下）
mkdir /tgz
复制到该目录下：
cp /tgz/jdk-8u45-linux-x64.tar.gz /usr/lib
在该目录下解压jdk：
cd /usr/lib
tar -zxvf jdk-8u45-linux-x64.tar.gz
2.修改环境变量
vi /etc/profile

JAVA_HOME=/usr/lib/jdk1.8.0_45
PATH=$JAVA_HOME/bin:$PATH
CLAsspATH=.:$JAVA_HOME/jre/lib/ext:$JAVA_HOME/lib/tools.jar
export PATH JAVA_HOME CLAsspATH

3.刷新环境变量
source /etc/profile
4.验证是否成功
java
java -version
三，安装Hadoop（安装所需要的安装包都放到tgz目录下）
1.安装Hadoop-2.5.2
cd /tgz
将hadoop复制到该目录下：
cp hadoop-2.5.2.tar.gz /opt/
在该目录下解压
cd /opt/
tar -zxvf hadoop-2.5.2.tar.gz
2.修改配置文件
vi /etc/profile

HADOOP_HOME=/opt/hadoop-2.5.2
PATH=$HADOOP_HOME/bin:$PATH
export HADOOP_HOME PATH

刷新文件
source /etc/profile
3.修改hadoop-env.sh配置文件
vi /opt/hadoop-2.5.2/etc/hadoop/hadoop-env.sh

export JAVA_HOME=/usr/lib/jdk1.8.0_45

4.修改yarn-env.sh配置文件
vi /opt/hadoop-2.5.2/etc/hadoop/yarn-env.sh

export JAVA_HOME=/usr/lib/jdk1.8.0_45

5.修改core-site.xml配置文件
vi /opt/hadoop-2.5.2/etc/hadoop/core-site.xml

<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoop-2.5.2/tmp</value>
        <description>Abase for other temporary directories.</description>
</property>
<property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop:9000</value>
</property>
<property>
        <name>io.file.buffer.size</name>
        <value>4096</value>
</property>

6.修改hdfs-site.xml配置文件
vi /opt/hadoop-2.5.2/etc/hadoop/hdfs-site.xml

<property>
        <name>dfs.namenode.name.dir</name>
        <value>/opt/hadoop-2.5.2/dfs/name</value>
</property>
<property>
        <name>dfs.datanode.data.dir</name>
        <value>/opt/hadoop-2.5.2/dfs/data</value>
</property>
<property>
        <name>dfs.replication</name>
        <value>2</value>
</property>
<property>
        <name>dfs.permissions</name>
        <value>false</value>
</property>

7.修改mapred-site.xml配置文件
 修改名称
mv /opt/hadoop-2.5.2/etc/hadoop/mapred-site.xml.template /opt/hadoop-2.5.2/etc/hadoop/mapred-site.xml
vi /opt/hadoop-2.5.2/etc/hadoop/mapred-site.xml

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
        <final>true</final>
</property>

8.修改yarn-site.xml配置文件
vi /opt/hadoop-2.5.2/etc/hadoop/yarn-site.xml

<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop</value>
</property>
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>

9.格式化hdfs
cd /opt/hadoop-2.5.2
bin/hadoop namenode -format
10.启动集群（过程中输入yes 密码000000）
cd /opt/hadoop-2.5.2/sbin/
./start-all.sh
11.jps查看是否正确

[root@hadoop sbin]# jps
18264 NameNode
18376 Datanode
18522 SecondaryNameNode
18954 NodeManager
18671 ResourceManager
19055 Jps

12.通过浏览器访问hdfs文件系统和yarn
公网IP:50070或者IP:8088
http://192.168.200.2:50070
http://192.168.200.2:8088
如图：

在这里插入图片描述

四，安装MysqL
1.将安装包放入tgz目录下，进入目录
cd /tgz/
2.解压缩MysqL到/usr/local目录
tar -zxvf MysqL-5.7.29-linux-glibc2.12-x86_64.tar.gz -C /usr/local/
3.进入到usr/local目录并重新命名
cd /usr/local/
mv MysqL-5.7.29-linux-glibc2.12-x86_64 /usr/local/MysqL
4.创建数据库目录
mkdir /data
mkdir /data/MysqL
5.新建MysqL 用户、组及目录
groupadd MysqL
useradd -r -s /sbin/nologin -g MysqL MysqL -d /usr/local/MysqL
6.改变目录属有者
cd /usr/local/MysqL/
chown -R MysqL .
chgrp -R MysqL .
chown -R MysqL /data/MysqL
7.配置参数（记住临时密码）
bin/MysqLd --initialize --user=MysqL --basedir=/usr/local/MysqL --datadir=/data/MysqL
bin/MysqL_ssl_rsa_setup --datadir=/data/MysqL
8.修改系统配置文件
cd /usr/local/MysqL/support-files
cp MysqL.server /etc/init.d/MysqL
vi /etc/init.d/MysqL

basedir=/usr/local/MysqL
datadir=/data/MysqL

9.启动MysqL
service MysqL start

如果报错
[root@hadoop support-files]# vi /etc/my.cnf
[MysqLd]
datadir=/data/MysqL
#socket=/var/lib/MysqL/MysqL.sock
# disabling symbolic-links is recommended to prevent assorted security risks
symbolic-links=0
# Settings user and group are ignored when systemd is used.
# If you need to run MysqLd under a different user or group,
# customize your systemd unit file for mariadb according to the
# instructions in http://fedoraproject.org/wiki/Systemd

[MysqLd_safe]
#log-error=/var/log/mariadb/mariadb.log
#pid-file=/var/run/mariadb/mariadb.pid

#
# include all files from the config directory
#
!includedir /etc/my.cnf.d

10.登录数据库
 MysqL -hlocalhost -uroot -p
如果出现：-bash: MysqL: command not found
执行： ln -s /usr/local/MysqL/bin/MysqL /usr/bin //没有出现就不用执行
输入生成的临时密码。
11.修改密码并赋给用户远程权限

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

MysqL> set password=password('000000');
Query OK, 0 rows affected, 1 warning (0.00 sec)

MysqL> grant all privileges on *.* to 'root'@'%' identified by '000000';
Query OK, 0 rows affected, 1 warning (0.00 sec)

MysqL> flush privileges;
Query OK, 0 rows affected (0.00 sec)

MysqL>

12.查看表

MysqL> use MysqL;
Reading table @R_738_4045@ion for completion of table and column names
You can turn off this feature to get a quicker startup with -A

Database changed
MysqL> select host,user from user;
+-----------+---------------+
| host      | user          |
+-----------+---------------+
| %         | root          |
| localhost | MysqL.session |
| localhost | MysqL.sys     |
| localhost | root          |
+-----------+---------------+
4 rows in set (0.00 sec)

MysqL>

13.使用navicate远程连接测试

在这里插入图片描述

五，安装hive
1.进入安装包目录，解压到/opt目录，将解压包重命名
cd /tgz/
tar -zxvf apache-hive-1.2.2-bin.tar.gz -C /opt/
cd /opt/
mv apache-hive-1.2.2-bin hive
2.配置hive环境变量
vi /etc/profile

export HIVE_HOME=/opt/hive
export PATH=$PATH:$HIVE_HOME/bin

source /etc/profile
3.进入到hive的配置文件目录
cd /opt/hive/conf/
4.修改相关配置文件
vi hive-site.xml （新建文件）

<configuration>
 <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:MysqL://192.168.200.2:3306/hive?&amp;createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8&amp;useSSL=false</value>
 </property>
<property>
    <name>javax.jdo.option.ConnectionUserName</name>
    <value>root</value>
</property>
<property>
    <name>javax.jdo.option.ConnectionPassword</name>
    <value>000000</value>
</property>
<property>
    <name>javax.jdo.option.ConnectionDriverName</name>
    <value>com.MysqL.jdbc.Driver</value>
</property>
<property>
    <name>datanucleus.schema.autocreateAll</name>
    <value>true</value> </property>
<property>
    <name>hive.metastore.schema.verification</name>
    <value>false</value>
 </property>
</configuration>

cp hive-env.sh.template hive-env.sh
vi hive-env.sh

HADOOP_HOME=/opt/hadoop-2.5.2
export HIVE_CONF_DIR=/opt/hive/conf

配置MysqL的驱动将MysqL驱动放到hive安装路径的lib目录下
cd /tgz
tar -zxvf mysql-connector-java-5.1.46.tar.gz
cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46.jar /opt/hive/lib/
6.初始化数据库
cd /opt/hadoop-2.5.2/share/hadoop/yarn/lib/
rm -rf jline-0.9.94.jar
cp /opt/hive/lib/jline-2.12.jar /opt/hadoop-2.5.2/share/hadoop/yarn/lib/
schematool -initSchema -dbType MysqL
7.启动hive

[root@hadoop lib]# hive

Logging initialized using configuration in jar:file:/opt/hive/lib/hive-common-1.2.2.jar!/hive-log4j.properties
hive>

8.测试

[root@hadoop lib]# hive

Logging initialized using configuration in jar:file:/opt/hive/lib/hive-common-1.2.2.jar!/hive-log4j.properties
hive> show databases;
OK
default
Time taken: 0.65 seconds, Fetched: 1 row(s)
hive> CREATE TABLE IF NOT EXISTS test (id INT,name STRING)ROW FORMAT DELIMITED FIELDS TERMINATED BY " " LInes TERMINATED BY "\n";
OK
Time taken: 0.218 seconds
hive> insert into test values(1,'a1');
Query ID = root_20200417120717_e68aeeb4-f762-483a-8b44-11bfe05351db
Total jobs = 3
Launching Job 1 out of 3
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_1587134257983_0001, Tracking URL = http://hadoop:8088/proxy/application_1587134257983_0001/
Kill Command = /opt/hadoop-2.5.2/bin/hadoop job  -kill job_1587134257983_0001
Hadoop job @R_738_4045@ion for Stage-1: number of mappers: 1; number of reducers: 0
2020-04-17 12:07:24,219 Stage-1 map = 0%,  reduce = 0%
2020-04-17 12:07:29,498 Stage-1 map = 100%,  reduce = 0%, Cumulative cpu 2.14 sec
MapReduce Total cumulative cpu time: 2 seconds 140 msec
Ended Job = job_1587134257983_0001
Stage-4 is selected by condition resolver.
Stage-3 is filtered out by condition resolver.
Stage-5 is filtered out by condition resolver.
Moving data to: hdfs://hadoop:9000/user/hive/warehouse/test/.hive-staging_hive_2020-04-17_12-07-17_995_7617816905121575467-1/-ext-10000
Loading data to table default.test
Table default.test stats: [numFiles=1, numRows=1, totalSize=5, rawDataSize=4]
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1   Cumulative cpu: 2.14 sec   HDFS Read: 3554 HDFS Write: 73 SUCCESS
Total MapReduce cpu Time Spent: 2 seconds 140 msec
OK
Time taken: 12.938 seconds
hive> select * from test;
OK
1       a1
Time taken: 0.078 seconds, Fetched: 1 row(s)
hive>

相关推荐