redis数据结构
redis全名(Remote Dictionary Server),即远程字典服务
redis的值的数据结构类型有String、List、Set、Hash、zset(sorted set,有序集合)、Bitmaps(位图)、HyperLogLogs
注意:我使用的版本是6.0.10,不同版本可能略有差别
redis中key的最大长度为512M
对象
typedef struct redisObject {
// 对象的类型
unsigned type:4;
// 编码
unsigned encoding:4;
// 记录最后一次被访问的时间
unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or
* LFU data (least significant 8 bits frequency
// 引用计数 * and most significant 16 bits access time). */
int refcount;
// 指向底层实现的指针
void *ptr;
} robj;
类型总览
redis中的数据类型,即为redisObject的type属性
// string
#define OBJ_STRING 0 /* String object. */
// list
#define OBJ_LIST 1 /* List object. */
// set
#define OBJ_SET 2 /* Set object. */
//zset
#define OBJ_ZSET 3 /* Sorted set object. */
//hash
#define OBJ_HASH 4 /* Hash object. */
// module
#define OBJ_MODULE 5 /* Module object. */
// stream
#define OBJ_STREAM 6 /* Stream object. */
#可以使用type命令来查看该键所对应值的类型
type key
redis的编码分类
对应于redisObject的ecoding属性,encoding是决定对象底层实现数据结构的
// 简单动态字符串 raw
#define OBJ_ENCODING_RAW 0 /* Raw representation */
// long类型的整数 int
#define OBJ_ENCODING_INT 1 /* Encoded as integer */
// 哈希表 hashtable
#define OBJ_ENCODING_HT 2 /* Encoded as hash table */
// 压缩 不再使用
#define OBJ_ENCODING_ZIPMAP 3 /* Encoded as zipmap */
// 双向链表 不再使用该结构
#define OBJ_ENCODING_LINKEDLIST 4 /* No longer used: old list encoding. */
// 压缩列表 ziplist
#define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist */
// 整数集合 intset
#define OBJ_ENCODING_INTSET 6 /* Encoded as intset */
// 跳表 skiplist
#define OBJ_ENCODING_SKIPLIST 7 /* Encoded as skiplist */
// embstr编码的简单动态字符串 embstr
#define OBJ_ENCODING_EMBSTR 8 /* Embedded sds string encoding */
// 快表 quicklist
#define OBJ_ENCODING_QUICKLIST 9 /* Encoded as linked list of ziplists */
// 流 stream
#define OBJ_ENCODING_STREAM 10 /* Encoded as a radix tree of listpacks */
可以使用命令
object encoding key
来查看该key使用的是哪种编码
127.0.0.1:6379> set test_int 1
OK
127.0.0.1:6379> object encoding test_int
"int"
127.0.0.1:6379> set test_raw zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz
OK
127.0.0.1:6379> strlen test_raw
(integer) 44
127.0.0.1:6379> object encoding test_raw
"embstr"
127.0.0.1:6379> set test_raw zzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzzz
OK
127.0.0.1:6379> object encoding test_raw
"raw"
127.0.0.1:6379> strlen test_raw
(integer) 45
String类型
string类型属于单值单value,是一个可变的字节数组,就像StringBuilder似的,可以追加、获取长度、截取等操作
扩容:当字符串长度小于1M时,扩容是现有空间进行加倍;当字符串长度超过1M,扩容只会多扩1M的空间。且字符串最长为512M
源码结构
struct __attribute__ ((__packed__)) sdshdr5 {
// 存储了字符串的类型和长度,3位存类型,5位存长度
unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
uint8_t len; /* used */
uint8_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
uint16_t len; /* used */
uint16_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
uint32_t len; /* used */
uint32_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
// 字符串长度
uint64_t len; /* used */
// 内存分配
uint64_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
// 字节数组
char buf[];
};
编码格式
| 编码 | 对象 | | ------------------- | ---------------------------------------------- | | OBJENCODINGINT | 使用整数值实现的字符串对象 | | OBJENCODINGEMBSTR | 使用embstr编码的简单动态字符串实现的字符串对象 | | OBJENCODINGRAW | 使用简单动态字符串实现的字符串对象 |
string有三种编码格式
int 整数值
embstr 用于存储短字符串的编码方式,字符串长度小于44字节使用,数据保存在一块连续的内存里
raw 字符串值长度大于44字节使用
embstr和raw两种编码的区别
embstr编码用于保存短字符串,与raw编码一样,都是使用redisObject结构和sdshdr结构来表示字符串对象,但是raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构,而embstr编码则通过调用一次内存分配函数来分配一块连续的内存空间,空间中依次包含redisObject和sdshdr两个结构
操作命令
值拼接
#给key对应的value进行拼接,返回的是拼接之后的字符长度
append k1 qwe
(integer) 5
值长度
strlen k1
数字运算操作
#加一
INCR k2
#减一
DECR k2
#加3
INCRBY k2 3
#减2
DECRBY k2 2
注意:这几个命令只能对数字进行操作,范围是Long.MIN~Long.MAX
获取值
get k1
#只获取该key所对应value的部分字符
getrange k1 0 2
设置值
# setrange覆盖部分值 其中0为从下标为0的字符开始替换
setrange k1 0 zx
(integer) 5
#设置值时设置过期时间
#setex key seconds value
setex k3 20 b
#如果key不存在设置值,防止覆盖(set if not exists)
#setnx key value
setnx k1 1
# 设置key的值,并返回key的旧值
getset k1 vv1
多值操作
#同时set多个键值
#mset key value [key value ...]
mset k4 v4 k5 v5
#同时获取多个键的值
#mget key [key ...]
mget k4 k5
#同时set多个键值(全部不存在时才会设置值)
#msetnx key value [key value ...]
msetnx k6 v6 k7 k8
List类型
List属于单值多value,链表用的是双向链表结构
list支持pop、push来操作头部和尾部,既可以用做栈也可以用做队列
源码结构
typedef struct listNode {
// 前驱节点
struct listNode *prev;
// 后继节点
struct listNode *next;
// 值
void *value;
} listNode;
typedef struct list {
// 头节点
listNode *head;
// 尾结点
listNode *tail;
// 节点值复制函数
void *(*dup)(void *ptr);
// 节点值释放函数
void (*free)(void *ptr);
// 节点值对比函数
int (*match)(void *ptr, void *key);
// 链表中包含的节点数量
unsigned long len;
} list;
这个结构不知道还用不用,因为看源码来说在创建list的时候创建的是quicklist
quicklist结构
typedef struct quicklist {
quicklistNode *head;
quicklistNode *tail;
unsigned long count; /* total count of all entries in all ziplists */
unsigned long len; /* number of quicklistNodes */
int fill : QL_FILL_BITS; /* fill factor for individual nodes */
unsigned int compress : QL_COMP_BITS; /* depth of end nodes not to compress;0=off */
unsigned int bookmark_count: QL_BM_BITS;
quicklistBookmark bookmarks[];
} quicklist;
typedef struct quicklistNode {
struct quicklistNode *prev;
struct quicklistNode *next;
unsigned char *zl;
unsigned int sz; /* ziplist size in bytes */
unsigned int count : 16; /* count of items in ziplist */
unsigned int encoding : 2; /* RAW==1 or LZF==2 */
unsigned int container : 2; /* NONE==1 or ZIPLIST==2 */
unsigned int recompress : 1; /* was this node previous compressed? */
unsigned int attempted_compress : 1; /* node can't compress; too small */
unsigned int extra : 10; /* more bits to steal for future usage */
} quicklistNode;
而对于quicklist编码的定义是
OBJ_ENCODING_QUICKLIST 9 /* Encoded as linked list of ziplists */
看代码像是存到quicklist中,然后又使用ziplist压缩的,毕竟不是专业的c语言开发,看的并不是那么明白
操作命令
设置值
#lpush(指从左边进 左进右出 就想是栈一样)
#lpush key element [element ...]
lpush list1 1 2 3 4 5
#取值
#lrange key start end (负下标表示的是从后往前,如-1表示倒数第一)
lrange list1 0 -1
1) "5"
2) "4"
3) "3"
4) "2"
5) "1"
#rpush(指从右边进 右进左出 就想是栈一样)
#rpush key element [element ...]
rpush list2 1 2 3 4 5
#给某个索引位置赋值
#lset key index element
lset list1 0 q
#在某个元素之前或之后插入一个元素
#linsert key before|after pivot element
linsert list1 before q zz
取值
#弹出栈顶元素(从左边开始弹出,弹出之后,list中就不存在该元素了)
#lpop key
lpop list1
#弹出栈顶元素(从右边开始弹出,弹出之后,list中就不存在该元素了)
#rpop key
rpop list1
#按照索引位置取值
#lindex key index
lindex list1 0
列表长度
llen list1
删除值
#删除几个某个元素
#lrem key count element
lrem list1 1 2
#截取指定范围的值赋给key(范围是索引)
#ltrim key start stop
ltrim list1 0 0
# 从头部删除元素 出栈
lpop list1
# 从尾部删除元素
rpop list1
出栈入栈
#从源列表右出栈压入左目标列表
#rpoplpush source dest
rpoplpush list2 list1
Set类型
set类型是单值多value,与List的区别在于不可重复,类似于HashSet,通过hash table实现的
set除了基本的增删改查操作之外,还可以使用集合来取并集、交集、差集,可以用来实现好友推荐等功能
编码格式
| 编码 | 对象 | | ------------------- | -------------------------- | | OBJENCODINGINTSET | 使用整数集合实现的集合对象 | | OBJENCODINGHT | 使用的hash table |
set有两种编码格式
intset 保存的元素全都是整数,且元素数量不超过512hash table 保存的不是整数
#根据该配置项来进行编码转换的
set-max-intset-entries 512
操作命令
设置值
#设置值
#sadd key member [member ...]
sadd set1 vv vc vb vv
取值
#取值
#smembers key
smembers set1
1) "vc"
2) "vb"
3) "vv"
#判断该元素是否在set中
#sismember key member
sismember set1 vv
#获取随机的元素(count表示获取的数量,默认为1)
#srandmember key [count]
srandmember set1 2
查看集合元素个数
#scard key
scard set1
删除
#srem key member
srem set1 vb
#随机出栈(默认数量为1)
#spop key [count]
spop set1
随机抽取
#随机从集合中抽取2个(默认1个)
#srandmember key [count]
srandmember set1 2
#将源集合中的值移至目标集合
#smove source dest member
smove set1 set2 5
差集 交集 并集
#差集 返回的是其他key与第一个key的差集
#sdiff key [key ...]
sdiff set1 set2
#交集
#sinter key [key ...]
sinter set1 set2
#并集
#sunion key [key ...]
sunion set1 set2
Hash类型
value是键值对,相当于HashMap,对于hash碰撞也是采用的HashMap的处理方式,数组+链表
更适合存储对象,将一个对象存储在hash类型中会占用更少的内存,且可以更方便的存取整个对象
编码格式
| 编码 | 对象 | | -------------------- | ---------------- | | OBJENCODINGZIPLIST | 使用ziplist | | OBJENCODINGHT | 使用的hash table |
set有两种编码格式
ziplist 一开始存储使用的ziplist,但是当满足一定条件时会转换为hash tablehash table
#根据该配置项来进行编码转换的
hash-max-ziplist-entries 512
hash-max-ziplist-value 64
源码结构
typedef struct dictht {
// 哈希表数组
dictEntry **table;
// 哈希表大小
unsigned long size;
// 哈希表大小掩码,用于计算索引值
unsigned long sizemask;
// 哈希表已有节点数量
unsigned long used;
} dictht;
typedef struct dictEntry {
// 键
void *key;
// 值
union {
void *val;
uint64_t u64;
int64_t s64;
double d;
} v;
// 下一个哈希节点,链表
struct dictEntry *next;
} dictEntry;
typedef struct dict {
// 类型
dictType *type;
// 私有数据
void *privdata;
// 哈希表
// ht[0]:用来存放真是的数据
// ht[1]:用于扩容
dictht ht[2];
//rehash 如果为-1表示没有进行rehash
long rehashidx; /* rehashing not in progress if rehashidx == -1 */
int16_t pauserehash; /* If >0 rehashing is paused (<0 indicates coding error) */
} dict;
redis哈希冲突将新节点添加在链表的表头
操作命令
设置值
#Redis4.0之后可以设置多个值,与hmset功能相同
#hset key field value [field value ...]
hset user id 123
#设置多个字段
#hmset key field value [field value ...]
hmset user name zhangsan age 18
#不存在则设置值
#hsetnx key field value
hsetnx user id 12
获取值
#hget key field
hget user id
#获取多个字段的值
#hmget key field [field ...]
hmget user id name sex age
#可以获取该key所对应的map
#hgetall key
hgetall user
#获取key对应的map有几个字段
#hlen key
hlen user
#判断该key的某个字段是否存在
#hexists key field
hexists user id
#获取该key下所有的字段
#hkeys key
hkeys user
#获取该key下所有的字段值
#hvals key
hvals user
删除字段值
#支持删除多个
#hdel key field [field ...]
hdel user age
数值操作
# 加2
# hincrby key field increment
hincrby user id 2
Zset类型
zset是sorted set,即有序的集合,在set的基础上加了一个score,类似于TreeSet,使用score来进行排序,也可以根据score的范围来获取元素的列表
原本set值为k1 v1 k2 v2,而zset是k1 score1 v1 k2 score2 v2
底层使用的是hash和跳表,hash用来关联value和score,保证value的唯一性,同时通过value可以获取到score。跳表的作用在于给value排序以及根据score的范围来获取元素列表
编码格式
| 编码 | 对象 | | --------------------- | -------------- | | OBJENCODINGZIPLIST | 使用ziplist | | OBJENCODINGSKIPLIST | 使用的skiplist |
zset有两种编码格式
ziplist 满足条件使用ziplist,否则使用skiplistskiplist
#根据该配置项来进行编码转换的
zset-max-ziplist-entries 128
zset-max-ziplist-value 64
操作命令
设置值
#zadd key score member [score member ...]
zadd zset1 1 q 2 w
取值
#WITHSCORES表示查询结果是否带着score
#zrange key start stop [WITHSCORES]
zrange zset1 0 -1
#根据score范围查询
#zrangebyscore key min max [WITHSCORES] [LIMIT offset count]
zrangebyscore zset2 0 1
#根据score的范围来计数
#zcount key min max
zcount zset2 0 10
#根据值来获取下标(根据score从小到大来排的序)
#zrank key member
zrank zset2 d
#根据值来获取下标(根据score从大到小来排的序)
#zrevrank key member
zrevrank zset2 d
#根据值来获取score
#zscore key member
zscore zset2 c
查看集合元素个数
#该key的元素个数
zcard zset2
删除
#zrem key member
zrem zset2 s
# 根据下标区间来删除(根据score从小到大来排的序)
#zremrangebyrank key start stop
zremrangebyrank zset1 5 8
# 根据score区间来删除
# zremrangebyscore key min max
zremrangebyscore zset1 7 10
数值操作
# 如果key中存在该元素,则该元素的score增加increment,否则新增该元素
# zincrby key increment member
zincrby zset1 2 b
Bitmap类型
位图不是一个真实的数据类型,是定义在字符串类型之上的面向位操作的集合。位图的最大优势在于节省空间
设置值
#setbit key offset value
# value只能是0或者1
setbit bittest 10 1
取值
#getbit key offset
# 如果offset超出范围的话返回0
getbit bittest 10
HyperLogLogs类型
暂时没有了解
各个类型的应用
- String: 缓存、限流、计数器、分布式锁、分布式Session
- List: 队列
- Set: 点赞、标签
- Hash: 存储对象
- Zset: 排行榜