hbase 里面有大量的数据,几 T 的那种,想导出部分的数据给其他系统测试接口用,有什么好的方法吗?
1
monkeylyf 2018-05-16 15:00:19 +08:00
直接读 hfile ?
问题描述的不是很清楚,再具体点:准备导出多大数据,数据的 rowkey 的分布大概是什么样的,导出时间要求多长。如果是一次性导出那就随便写个都行啊。 |
2
anonymoustian OP @monkeylyf 就想像 sql 一样,limit 100~200 的这种。rowkey 就是随机分
|
3
monkeylyf 2018-05-16 16:13:19 +08:00
@anonymoustian hbase batch get 目测满足你的需求。
|