文章出處

1.建立HBase預分區表。sql語句如下:

create 'buyer_calllogs_info_ts', 'record', {SPLITS_FILE => 'hbase_calllogs_splits.txt'}

或者

create 't1','f1' ,SPLITS=>['10','20','30','40']

分區文件格式如下:

00|
10|
20|
30|
40|
50|
60|
70|

優點:合理設計rowkey 能讓各個region 的并發請求 平均分配(趨于均勻) 使IO 效率達到最高

2.如果在建表之后沒有設置壓縮而數據量又很大怎么辦。

①disable 'test'

②alter 'test', NAME => 'c', COMPRESSION => 'snappy' 也可以修改version。alter 'test',{NAME=>'f1',VERSIONS=>3}

③enable 'test'

④major_compact 'test'

⑤describe 'test'

查看是否設置成功,不要再HBase繁忙的時候進行合并,盡量在空閑的時候合并。

 


文章列表


不含病毒。www.avast.com
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()