文章出處
文章列表
1.建立HBase預分區表。sql語句如下:
create 'buyer_calllogs_info_ts', 'record', {SPLITS_FILE => 'hbase_calllogs_splits.txt'}
或者
create 't1','f1' ,SPLITS=>['10','20','30','40']
分區文件格式如下:
00|
10|
20|
30|
40|
50|
60|
70|
優點:合理設計rowkey 能讓各個region 的并發請求 平均分配(趨于均勻) 使IO 效率達到最高
2.如果在建表之后沒有設置壓縮而數據量又很大怎么辦。
①disable 'test'
②alter 'test', NAME => 'c', COMPRESSION => 'snappy' 也可以修改version。alter 'test',{NAME=>'f1',VERSIONS=>3}
③enable 'test'
④major_compact 'test'
⑤describe 'test'
查看是否設置成功,不要再HBase繁忙的時候進行合并,盡量在空閑的時候合并。
文章列表
全站熱搜