hbase相关操作

1.设置hbase的 region的大小

HBase中的Region大小是可以配置的，通过设置HBase表的最小和最大Region大小来控制。一般情况下，Region大小的设置应该根据应用需求和硬件资源进行调整。以下是设置HBase Region大小的方法：

1.1 修改HBase表的最小和最大Region大小：

可以通过HBase shell或HBase API来修改表的最小和最大Region大小。例如，可以使用以下命令将表的最小Region大小设置为1GB，最大Region大小设置为2GB：

alter 'table_name', {NAME => 'f', MIN_VERSIONS => 1, MAX_VERSIONS => 1, TTL => 86400, BLOCKSIZE => 1073741824, MIN_BLOCK_SIZE => 1073741824, MAX_BLOCK_SIZE => 2147483648, KEEP_DELETED_CELLS => true}

1.2 通过RegionServer的heap大小来控制Region大小：

Region大小也可以通过RegionServer的heap大小来控制。如果RegionServer的heap大小为16GB，则可以将每个Region的大小设置为1GB，这样每个RegionServer最多可以管理16个Region。这个设置可以在HBase集群中的hbase-site.xml文件中进行配置：

<property>
  <name>hbase.regionserver.global.memstore.upperLimit</name>
  <value>0.4</value>
</property>
<property>
  <name>hbase.regionserver.global.memstore.lowerLimit</name>
  <value>0.2</value>
</property>

其中，hbase.regionserver.global.memstore.upperLimit和hbase.regionserver.global.memstore.lowerLimit属性分别用于控制RegionServer的heap大小。可以根据实际需求进行调整。

2.hbase禁止region分裂

在HBase中，Region分裂是一种自动的机制，用于在Region大小达到一定阈值时将其分裂成两个Region，以便更好地管理数据。但在某些情况下，可能需要禁止Region分裂，例如在进行HBase数据导入时。以下是禁止Region分裂的方法：

2.1 在HBase shell中禁止Region分裂：

可以在HBase shell中使用以下命令禁止Region分裂：

disable 'table_name'
alter 'table_name', METHOD => 'table_att', 'SPLIT_POLICY' => 'org.apache.hadoop.hbase.regionserver.DisabledRegionSplitPolicy'
enable 'table_name'

这个命令将禁止HBase表的Region分裂。需要注意的是，禁止Region分裂后，当表的大小达到一定阈值时，数据将不再分裂成新的Region，因此需要根据实际需求进行调整。

2.2 在HBase配置文件中禁止Region分裂：

可以在HBase配置文件中设置hbase.hregion.max.filesize属性来控制Region的大小，从而禁止Region分裂。例如，可以将hbase.hregion.max.filesize属性设置为100GB，这样当Region大小达到100GB时，将不再进行分裂。这个设置可以在HBase集群中的hbase-site.xml文件中进行配置：

<property>
  <name>hbase.hregion.max.filesize</name>
  <value>107374182400</value>
</property>

需要注意的是，禁止Region分裂可能会导致Region的大小过大，从而影响查询性能。因此，应该根据实际情况进行调整。

3.METHOD => 'table_att’表示啥

在HBase中，‘METHOD’ => 'table_att’表示修改表的属性（table_att）。这个属性用于指定对HBase表的操作，例如修改表的最大版本数、最小版本数、TTL、块大小等。在HBase shell中，可以使用’alter’命令来修改表的属性，例如：

alter 'table_name', BLOCKSIZE => 1073741824}

这个命令将表的列族f的最小版本数设置为1，最大版本数设置为1，TTL设置为86400秒，块大小设置为1GB。在这个命令中，‘METHOD’ => 'table_att’表示使用表的属性来修改表的设置。

4.hbase禁止分裂必须使用这个参数么METHOD => ‘table_att’

在HBase中，禁止Region分裂的操作可以使用’alter’命令来进行，而’METHOD’ => 'table_att’参数并不是必需的。这个参数是用于指定对表的操作是修改表的属性，例如修改表的最大版本数、最小版本数、TTL、块大小等。在禁止Region分裂的操作中，可以直接使用以下命令：

disable 'table_name'
alter 'table_name', 'SPLIT_POLICY' => 'org.apache.hadoop.hbase.regionserver.DisabledRegionSplitPolicy'
enable 'table_name'

5.java代码建表时候可以设置hbase禁止分裂么

在Java代码中，可以使用HBase API来创建HBase表，并设置禁止Region分裂。以下是Java代码示例：

// 创建HBase Configuration对象
Configuration conf = HBaseConfiguration.create();

// 创建HBase表描述符
HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf("table_name"));

// 创建列族描述符
HColumnDescriptor columnDescriptor = new HColumnDescriptor(Bytes.toBytes("column_family"));

// 设置列族的最小版本数、最大版本数、TTL和块大小
columnDescriptor.setMinVersions(1);
columnDescriptor.setMaxVersions(1);
columnDescriptor.setTimeToLive(86400);
columnDescriptor.setBlocksize(1073741824);

// 设置禁止Region分裂
tableDescriptor.setRegionSplitPolicyClassName("org.apache.hadoop.hbase.regionserver.DisabledRegionSplitPolicy");

// 将列族描述符添加到表描述符中
tableDescriptor.addFamily(columnDescriptor);

// 创建HBase表
Admin admin = ConnectionFactory.createConnection(conf).getAdmin();
admin.createTable(tableDescriptor);
admin.close();

在这个示例中，通过设置tableDescriptor.setRegionSplitPolicyClassName(“org.apache.hadoop.hbase.regionserver.DisabledRegionSplitPolicy”)来禁止Region分裂。同时，可以使用HColumnDescriptor的方法来设置列族的最小版本数、最大版本数、TTL和块大小等属性。

6.java代码建表时候可以设置hbase的region大小么

在Java代码中，可以使用HBase API来创建HBase表，并设置表的Region大小。以下是Java代码示例：

// 创建HBase Configuration对象
Configuration conf = HBaseConfiguration.create();

// 创建HBase表描述符
HTableDescriptor tableDescriptor = new HTableDescriptor(TableName.valueOf("table_name"));

// 创建列族描述符
HColumnDescriptor columnDescriptor = new HColumnDescriptor(Bytes.toBytes("column_family"));

// 设置列族的最小版本数、最大版本数、TTL和块大小
columnDescriptor.setMinVersions(1);
columnDescriptor.setMaxVersions(1);
columnDescriptor.setTimeToLive(86400);
columnDescriptor.setBlocksize(1073741824);

// 设置表的Region大小
tableDescriptor.setValue("SPLIT_POLICY", "org.apache.hadoop.hbase.regionserver.ConstantSizeRegionSplitPolicy");
tableDescriptor.setValue("MAX_FILESIZE", "1073741824");

// 将列族描述符添加到表描述符中
tableDescriptor.addFamily(columnDescriptor);

// 创建HBase表
Admin admin = ConnectionFactory.createConnection

原文地址：https://blog.csdn.net/wuchongyong/article/details/130840639