HBase简介
HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化数据的分布式存储系统》。HBase以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇(column family)。欲了解HBase的官方资讯,请访问HBase官方网站。
HBase的运行有三种模式:单机模式、伪分布式模式、分布式模式。
单机模式:在一台计算机上安装和使用HBase,使用Ubuntu本地文件系统保存数据,不涉及数据的分布式存储HDFS;
伪分布式模式:在一台计算机上模拟一个小的集群,数据使用分布式文件系统HDFS存储;
分布式模式:使用多台计算机实现物理意义上的分布式存储。这里出于学习目的,我们只重点讨论单机模式和伪分布式模式。
下载HBase安装文件
cd /home
wget https://mirrors.aliyun.com/apache/hbase/2.1.9/hbase-2.1.9-bin.tar.gz
解压
tar -zxvf /home/hbase-2.1.9-bin.tar.gz -C /usr/local
cd /usr/local
sudo mv hbase-2.1.9 hbase
环境变量
export HBASE_HOME=/usr/local/hbase
export PATH=$PATH:${HBASE_HOME}/bin
使环境变量生效
source /etc/profile
查看HBase版本,确定HBase是否安装成功,命令如下:
/usr/local/hbase/bin/hbase version
HBase伪分布式模式配置
cd /usr/local/hbase/conf
vim hbase-env.sh
配置JAVA_HOME,HBASE_CLASSPATH,HBASE_MANAGES_ZK.
HBASE_CLASSPATH设置为本机Hadoop安装目录下的conf目录(即/usr/local/hadoop/conf)
export JAVA_HOME=/usr/local/java/jdk1.8.0_45
export HBASE_CLASSPATH=/usr/local/hadoop/conf
export HBASE_MANAGES_ZK=true
编辑hbase-site.xml
vim hbase-site.xml
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://192.168.1.106:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
</configuration>
上面配置中,hbase.rootdir指定HBase的存储目录;hbase.cluster.distributed设置集群处于分布式模式。
上面配置中,192.168.1.106是你的阿里云ECS实例的私网IP地址,你的私网IP地址可能不是这个,可以登录阿里云控制台,查询自己的ECS实例的私网IP地址。
测试运行HBase
第一步:首先启动Hadoop,如果已经启动hadoop请跳过此步骤
第二步:启动HBase.
start-hbase.sh
jps,看进程信息
进入shell界面:
hbase shell
create 'student','Sname','Ssex','Sage','Sdept','course'
添加数据
put 'student','95001','Sname','LiYing'
查看数据
get 'student','95001'
hbase的web网页查看(需要先开安全组)
公网ip:60010
引用:
Comments | NOTHING