https://issues.apache.org/jira/browse/HBASE-12590
[HBASE-12590] A solution for data skew in HBase-Mapreduce Job - ASF JIRA
1, Motivation In production environment, data skew is a very common case. A HBase table may contains a lot of small regions and several large regions. Small regions waste a lot of computing resources. If we use a job to scan a table with 3000 small regions
issues.apache.org
위의 링크에 따르면
hbase.mapreduce.input.autobalance = true
로 옵션을 지정하면
data 의 auto balance 가 된다고 한다.
'HBase' 카테고리의 다른 글
[HBase] 성능 튜닝 참고 링크들 (0) | 2019.12.02 |
---|---|
[HBase] Snappy 설치 및 적용 방법 (0) | 2019.11.30 |
[HBase] 테이블 partition 개수와 block size 조절하는 방법 (0) | 2019.11.21 |
[HBase] table 의 partition 개수 조절하기 (0) | 2019.11.20 |
[HBase] org.apache.hadoop.hbase.util.FileSystemVersionException: hbase.version file is missing. 에러 해결 방법 (0) | 2019.11.14 |