大数据开发 Hbase 性能优化总结 因为一个cf会对应一个store,每个store都有一个Memstore,当触发flush阈值后进行flush的最小单位是Region,而不是MemStore级别的,所以会有多个cf被flush,会生成多个HFile文件。并且HFile多了就会频繁触发compact。最终导致系统产生更多的I/O。批量数据写入采用 BulkLoad HBase通过rowkey、family、qualifier、TimeStamp可以对HBase中的数据进行快速定位,HBase中rowkey可以唯一标识一行记录。 yuziyue 29 Jul 2023 · 4 min read
大数据开发 HBase 数据库架构原理大总结 HBase是一个开源的Key-Value型数据库,运行于HDFS文件系统之上,它本本质上是一个多维稀疏排序Map。HBase本质上是一个Map结构数据库,HBase中Map的key是一个复合键,由rowkey、column family、qualifier、type以及timestamp组成,value即为cell的值。比如: yuziyue 28 Jul 2023 · 13 min read