微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Hive的使用

Hive

Apache Hive一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类sql语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

 

#hive查看一个表的详细信息,类似一些sql数据库
desc formatted 表名

 

安装

java安装:

java官网下载网页:https://www.oracle.com/java/technologies/javase-jdk13-downloads.html

运行后,在terminal查看:java --version。可以看到版本号信息。

网上找的一篇安装文章https://juejin.im/post/5d36d9ea6fb9a07ee16968f3 (还要进行配置?)

安装hadoop

网上找的一篇安装文章: https://zhuanlan.zhihu.com/p/33117305

下载 hadoop-2.8.2.tar.gz 

解压缩在/Users/chentianwei/hadoop文件夹内。

添加环境变量:

在 .bash_profile 文件中配置 Hadoop 的环境变量,使用 vim 打开该文件, 输入下面代码,使用:wq保存退出, 。

 23 # 加载hadoop环境,目的是使用hive
 24 export HADOOP_HOME=/Users/chentianwei/hadoop/hadoop-2.8.2-src
 25 export PATH=$PATH:$HADOOP_HOME/bin

 

然后运行 source 命令使文件中的修改立即生效.

在终端执行命令:hadoop version。

❌,我这类没有显示版本号。

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐