Sqoop安装及基本使用

Sqoop:     1、sqoop从数据库中导入数据到HDFS     2、SQOOP从数据库导入数据到hive     3、sqoop从hive中将数据导出到数据库   sqoop底层还是执行的mapreduce程序,,但是特殊的地方只有map TASK     可以实现:企业级数据仓库、文档型系统、关系型数据库<-->   sqoop安装:     1、tar -zxvf sqoop-1.4.6-cdh5.5.2.tar.gz     2、将mysql的驱动包mysql-connector-java-5.1.43.jar拷贝到sqoop home/lib下面         cp mysql-connector-java-5.1.43.jar sqoop-1.4.6-cdh5.5.2/lib/     3、配置环境变量         export SQOOP_HOME=/yang/sqoop-1.4.6-cdh5.5.2         export PATH=$PATH:$SQOOP_HOME/bin     4、配置SQOOP ,cd sqoop-1.4.6-cdh5.5.2/conf/         mv sqoop-env-template.sh sqoop-env.sh                  export HADOOP_COMMON_HOME=/yang/hadoop-2.6.5         export HADOOP_MAPRED_HOME=/yang/hadoop-2.6.5         export HBASE_HOME=/yang/hbase-1.2.5         export HIVE_HOME=/yang/apache-hive-2.1.1-bin       5、source /etc/profile     6、sqoop version    开始使用:         前提:mysql可以正常使用         hdfs服务开启start-dfs.sh start-yarn.sh         hive服务开启 nohup hive --service metastore &  查看数据库有哪些表             sqoop list-tables --connect jdbc:mysql://192.168.100.121:3306/big_data --username root -P             或者(上面大写P会让你在控制台输入密码)             sqoop list-tables --connect jdbc:mysql://192.168.100.121:3306/big_data --username root --password 1234             sqoop list-tables --connect jdbc:mysql://192.168.100.121:3306/big_data --username root -P    #使用 sqoop将数据库的数据导入到 Hdfs(地址使用默认地址/user/$user/tabname) 斜杠后面不能有空格 而且需要启动yarn,因为要sqoop底层要执行mapreduce 当执行报错;classwrite的时候加入:--driver com.mysql.jdbc.Driver \ sqoop import \ --connect jdbc:mysql://192.168.100.121:3306/big_data \ --driver com.mysql.jdbc.Driver \ --username root \ --password 1234 \ --table t_area 需要放入那张表                           #使用指定的输出目录 --target-dir /tmp \             #使用指定的并发数量 -m 2 sqoop import \ --connect jdbc:mysql://192.168.100.121:3306/big_data \ --driver com.mysql.jdbc.Driver \ --username root \ --password 1234 \ --table t_area \ --target-dir /sqoop \ -m 2 #使用sqoop将HDFS文件导出到 MYSQL 表中,默认MAP为 4个 ,先将空表建好t_area_copy1 sqoop export \ --connect jdbc:mysql://192.168.100.121:3306/big_data \ --driver com.mysql.jdbc.Driver \ --table t_area_copy1 \ --username root \ --password 1234 \ --export-dir hdfs://192.168.200.200:9000/sqoop   mysql导入到hive:     注意需要启动服务:hive服务开启 nohup hive --service metastore &                     再来启动hive      #使用自定义的条件,并且过滤字段,并发数为1 #切分的字段可以更改为另外一个字段   sqoop import \ --hive-import \ --hive-table t_area \ --connect jdbc:mysql://192.168.128.121:3306/big_data \ --username root \ --password 1234 \ --query "SELECT * from t_area where \$CONDITIONS"  \ //将mysql中的表导入到hive表t_area --fields-terminated-by "," \ //按,分割,首先在hive中将表建好(z字段对应),并按,分割 --lines-terminated-by "\n" \ --target-dir /tmp/aa \ //临时存放的目录 -m 1 异常:org.apache.hadoop.hive.conf.HiveConf     Make sure HIVE_CONF_DIR is set correctly     解决:     在/etc/profile下面加上:         HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*         分布发送到其他主机上 source 一下      sqoop export \ --connect jdbc:mysql://192.168.100.121:3306/big_data \ 将hive的数据导出到mysql:是通过hdfs中的路径导入到mysql中 如果需要通过导入指定行的话,需要建立中间表 --driver com.mysql.jdbc.Driver \ --table t_area1 \    //导入到mysql表t_area1 --username root \ --password 1234 \     --export-dir /user/hive/warehose/t_area \          这个文件路径从hdfs上知道 --input-fields-terminated-by ',' 是以,分割的  

原文地址:https://www.cnblogs.com/yfb918/p/10411507.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


连接数据库的方式:第一种方式:ODBC:开放数据库连接是微软公司开放服务结构中有关数据库的一个组成部分,是数据库访问接口标准。ODBC是基于C语言实现的。提供了语言和数据库进行交互的一致性的接口,便于语言和数据库通信以及语言对数据库的各种操作。第二种方式:JDBC(本章重点)在Java中,
JDBCRequest 使用VariableNamesmysql:数据库连接池对象variousname:设置的变量名称 如何使用该变量a_#、b_#、c_#、d_#:代表行数a_1:第1行、第1列b_2:第2行、第2列
 1.JDBCDBC(JavaDataBaseConnectivity):Java数据库连接技术:具体讲就是通过Java连接广泛的数据库,并对表中数据执行增、删、改、查等操作的技术。JDBC是数据库与Java代码的桥梁。JDBC中定义了操作数据库的各种接口和类型:增删改基本操作:(1)获取连接:Connectionconnection=
1.需要jar包的支持:java.sqljavax.sqlmysql-conneter-java...连接驱动(必须要导入)<dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId><version>5.1.46</version></depend
1.简介Activiti是一个业务流程管理(BPM)框架,它是覆盖了业务流程管理,工作流,服务协作等领域的一个开源,灵活的,易扩展的可执行流程语言框架。在Java工作流引擎中可谓是主流,我们的项目也是使用的这个框架进行流程相关的开发。与流程息息相关的就是我们的流程定义BPMN文件,包含有一系列
1.JDBC体系系统一组规范:接口JDBC接口(API)包括两个层次:面向应用的API:JavaAPI,抽象接口,供应用开发人员使用(连接数据库,执行SQL语句,获得结果)面向数据库的API:JavaDriverAPI,供开发商开发数据库驱动程序JDBC是sun公司提供一套用于数据库操作的接口,java程序员只需要面向这套接
原文链接JDBC一般指Java数据库连接(JavaDatabaseConnectivity)api应用程序接口(API):可以调用或者使用类/接口/方法等去完成某个目标。API制定的类/方法可以做什么。API由开发人员调用。spi服务提供接口(SPI):需要继承或实现某些类/接口/方法等去完成某个目标。SPI告诉你
spring.shardingsphere.datasource.names=#省略数据源配置,请参考用法#标准分表配置spring.shardingsphere.rules.sharding.tables.<table-name>.actual-data-nodes=#描述数据源名称和实际表,分隔符为点,多个数据节点用逗号分隔,支持内联表达式。Absent表示仅对数据库进行分片
1问题Cannotloaddriverclass:com.mysql.cj.jdbc.Driver 2解决方案2.1已解决2.1.1首先,去查看项目中MySQL的版本如果找不到,说明可能还没有jdbc驱动,需要配置或者引入       (1)如果是直接引用的jar包,就去lib文件夹中查看,后缀是版
JDBC一、JDBC概述什么是JDBC?JDBC是使用Java语言操作关系型数据库的一套API。这套API是交由不同的数据库厂商实现的。我们利用JDBC编写操作数据库的代码,真正执行的是各个数据库的实现类(驱动)。全称:(JavaDataBaseConnectivity)Java数据库连接。JDBC的好处面向接口编
说明:/*需要引入依赖<dependency><groupId>mysql</groupId><artifactId>mysql-connector-java</artifactId><version>8.0.18</version></dependency>*/代码:objec
1.概要在“配置元件”中添加“JDBCConnectionConfiguration”。配置如下图: 2.重点:配置人大金仓数据库连接下面着重介绍人大金仓数据库连接配置:DatabaseURL输入:jdbc:kingbase8://192.132.180.101:54321/hj_yc   (备注:应输入 jdbc:kingbase8://IP:
JDBC概念:JavaDataBaseconnectivityJava数据库连接,Java语言操作数据库JDBc本质∶其实是官方(sun公司)定义的一套操作所有关系型数据库的规则,即接口。各个数据库商去实现这套接口,提供数据库驱动jar包。我们可以使用这套接口(JDBC)编程,真正执行的代码是驱动jar包中的实现类
Mybatis核心配置文件习惯上命名mybatis-config.xml,整合Spring之后,整个配置文件可以省略核心配置文件主要用于配置连接数据库的环境以及MyBatis的全局配置信息标签顺序顺序出错会报错propertiessettingstypeAliasestypeHandlersobjectFactoryobjectWrapperFa
JDBC1.概念:JavaDataBaseConnectivityJava数据库连接,Java语言操作数据库JDBC本质:其实是官方(sun公司)定义的一套操作所有关系型数据库的规则,即接口。各个数据库厂商去实现这套接口,提供数据库驱动jar包。我们可以使用这套接口(JDBC)编程,真正执行的代码是驱动jar包中的实现类。
  1.出现这个问题的原因 :在安装mysql的时候时区设置的不正确,mysql默认的是美国的时区,而我们中国大陆要比他们迟8小时,采用+8:00格式使用的数据库是MySQL,没有指定MySQL驱动版本的情况下它自动依赖的驱动是8.0.12很高的版本,这是由于数据库和系统时区差异所造成的,在jdbc连
一、环境准备1.数据库创建2个库2个表:xdclass_shop_order_0product_order_0product_order_1ad_configproduct_order_item_0product_order_item_1xdclass_shop_order_1product_order_0product_order_1ad_configproduct_order_item_0product_order_item_1数据
编写配置文件(application.yml)spring:datasource:username:rootpassword:123456url:jdbc:mysql://localhost:3306/mybatis?useUnicode&characterEncoding=utf-8driver-class-name:com.mysql.cj.jdbc.Driver测试连接@SpringBootTestclassSprin
结构图pom.xml<?xmlversion="1.0"encoding="UTF-8"?><projectxmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http:/
MySql链接url参数详解 jdbc:mysql://[host:port],[host:port].../[database][?参数名1][=参数值1][&参数名2][=参数值2]... 常用的几个较为重要的参数: 参数名称参数说明缺省值最低版本要求 user 数据库用户名(用于连接数据库) 所有版本passWord用户密码(用于连接