HBase 分布式数据库

  • 时间:
  • 浏览:1
  • 来源:uu快3下载网站_uu快3开户二维码

作者接触HBase时间不长,无法估量在企业中流行程度,但已深感你这一 系统的强大。本文是作者某些感悟,和HBase的入门shell和Api,希望作为入门参考。

启动命令

我从来没见过亲戚亲戚朋友单位的主库系统,无论是小机可能EMC。可能什么时候在值班时,收到通知主库挂了,我会虽然是三个白 深藏在机房沉重铁门里的亲戚亲戚朋友伙,冒了几缕青烟,紧接着监控上各种Web小图标就都红了....

随着版本迭代,安装步骤可能变化,参照https://hbase.apache.org/book.html#getting_started。

菜鸟就会很懵逼,事务?增全版查是事务吗?

哪些地方是事务,虽然好多好多 清楚,但虽然分布式不到替换集中存储,主要可能性能,在几瓶数据规模下集中存储提供更高的性能。50000万条数据确定Mysql,1亿左右确定Oracle,10亿条数据用大数据。

好多好多 事先,HBase被当做HDFS系统的管理系统,将文件作为内容直接存储在HBase中,实现海量文件的索引、查找。

03年(作者上大二),谷歌发表了三篇论文:Google FS、MapReduce、BigTable。虽然Google没人 发表声明你这一 个 产品的源码,倘若他发布了你这一 个 产品的全版设计论文,奠定了风靡全球的大数据算法的基础!

至于高可靠,加各种HA吧。

和MySql一样,先用shell完成某些操作。

列:course:math====值:90

列:grade:====值:3

HBase好多好多 基于BigTable思想,由开源社区发布的实现,除了CURD之外,还有好多好多 特点:

Table scores is ENABLED

scores

COLUMN FAMILIES DESCRIPTION

{NAME => 'course', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false',

KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER',

COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '

65536', REPLICATION_SCOPE => '0'}

{NAME => 'grade', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', K

EEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', C

OMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '6

5536', REPLICATION_SCOPE => '0'}

COLUMN CELL

course:math timestamp=15344929350043, value=97

grade: timestamp=1534492881763, value=5

hbase(main):011:0> delete 'scores', 'Tom', 'course:math'

0 row(s) in 0.0640 seconds

hbase(main):012:0> get 'scores', 'Tom', 'grade', 'course'

COLUMN CELL

grade: timestamp=1534492881763, value=6

1 row(s) in 0.0210 seconds

在5、6年前,亲戚亲戚朋友就希望能用分布式存储和分布式数据库来替代集中存储,虽然分布式廉价,倘若高可靠。

虽然,分布式存储不到替代集中存储。可能你问三个白 老鸟,他会让人三个白 关键字--事务。传统的集中存储有很强大的事务支持能力,而分布式系统不支持事务。