组件 | 描述 |
数据模型 | (row : string, column : string, time : int64) > value : string |
行 (Row) | 行是二进制串,最大长度为64KB。
通常实际应用中,行字符串为10~100字节。
对统一行内的数据的读或写总是原子的。
行用于标识数据记录的唯一标识符,例如网页的URL。 |
行排序 | 介绍按行(row)进行字典序排序。
相似的行(如域名相似的网页)会被聚集在一起,有利于数据压缩和特定应用程序的效率。 |
子表 (Tablet) | 介绍按行动态切分,每个切分后的块称为子表。
每个子表一般不超过256MB。
子表是worker进行加载/卸载和负载平衡的基本单元。 |
列 (Column) | 列按列族(column family)分组。
同一列族内的单元格的内容存储相关数据,通常用于数据访问控制和压缩设置。 |
列族 (Column Family) | 列族是一组相关列的集合。
列族必须在创建介绍时定义,但列可以动态添加。 |
时间戳 (Time) | 每个单元格(cell)都可以存储同一数据的多个版本,由不同的时间戳标识。
通常时间戳表示数据写入的时间。 |
值 (Value) | 单元格的值是存储在分布式介绍中的实际数据。
值是字符串类型,实际应用中可以存储任意二进制数据。 |