HBase简介

HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化数据的分布式存储系统》。HBase以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇(column family)。欲了解HBase的官方资讯,请访问HBase官方网站。

HBase的运行有三种模式:单机模式、伪分布式模式、分布式模式。

单机模式:在一台计算机上安装和使用HBase,使用Ubuntu本地文件系统保存数据,不涉及数据的分布式存储HDFS;

伪分布式模式:在一台计算机上模拟一个小的集群,数据使用分布式文件系统HDFS存储;
分布式模式:使用多台计算机实现物理意义上的分布式存储。这里出于学习目的,我们只重点讨论单机模式和伪分布式模式。

下载HBase安装文件

cd /home
wget https://mirrors.aliyun.com/apache/hbase/2.1.9/hbase-2.1.9-bin.tar.gz

解压

tar -zxvf /home/hbase-2.1.9-bin.tar.gz -C /usr/local
cd  /usr/local
sudo mv hbase-2.1.9 hbase

环境变量

export HBASE_HOME=/usr/local/hbase
export PATH=$PATH:${HBASE_HOME}/bin

使环境变量生效

source /etc/profile

查看HBase版本,确定HBase是否安装成功,命令如下:

/usr/local/hbase/bin/hbase version

HBase伪分布式模式配置

cd  /usr/local/hbase/conf
vim hbase-env.sh

配置JAVA_HOME,HBASE_CLASSPATH,HBASE_MANAGES_ZK.
HBASE_CLASSPATH设置为本机Hadoop安装目录下的conf目录(即/usr/local/hadoop/conf)

export JAVA_HOME=/usr/local/java/jdk1.8.0_45
export HBASE_CLASSPATH=/usr/local/hadoop/conf 
export HBASE_MANAGES_ZK=true

编辑hbase-site.xml

vim hbase-site.xml
<configuration>
        <property>
                <name>hbase.rootdir</name>
                <value>hdfs://192.168.1.106:9000/hbase</value>
        </property>
        <property>
                <name>hbase.cluster.distributed</name>
                <value>true</value>
        </property>
</configuration>

上面配置中,hbase.rootdir指定HBase的存储目录;hbase.cluster.distributed设置集群处于分布式模式。

上面配置中,192.168.1.106是你的阿里云ECS实例的私网IP地址,你的私网IP地址可能不是这个,可以登录阿里云控制台,查询自己的ECS实例的私网IP地址。

测试运行HBase

第一步:首先启动Hadoop,如果已经启动hadoop请跳过此步骤

第二步:启动HBase.

start-hbase.sh

jps,看进程信息

进入shell界面:

hbase shell
create 'student','Sname','Ssex','Sage','Sdept','course'

添加数据

put 'student','95001','Sname','LiYing'

查看数据

get 'student','95001'

hbase的web网页查看(需要先开安全组)

公网ip:60010

引用:

http://dblab.xmu.edu.cn/blog/install-hbase/

Last modification:April 12th, 2020 at 05:56 pm
如果觉得我的文章对你有用,请随意赞赏