深入剖析Redis系列(四) - Redis数据结构与全局命令概述

4,749 阅读6分钟

前言

Redis 提供了 5 种数据结构。理解每种数据结构的特点,对于 Redis开发运维 非常重要,同时掌握 Redis单线程命令处理 机制,会使 数据结构命令 的选择事半功倍。

接下来的几篇文章,将从如下几个方面介绍 Redis 的几种数据结构,命令使用及其应用场景。

  • 预备知识:几个简单的 全局命令数据结构内部编码单线程命令 处理机制分析。
  • 数据结构特性5数据结构 的特点、命令使用应用场景
  • 数据管理键管理遍历键数据库管理

其他文章

正文

1. 预备知识

在介绍 5数据结构 之前,需要先了解 Redis 的一些 全局命令数据结构内部编码单线程命令处理机制

  1. Redis 的命令有 上百个,理解 Redis 的一些机制,会发现这些命令有很强的 通用性

  2. Redis 不是万金油,有些 数据结构命令 必须在 特定场景 下使用,一旦 使用不当 可能对 Redis 本身 或者 应用本身 造成致命伤害。

2. 全局命令

Redis5数据结构,它们是 键值对 中的 ,对于 来说有一些通用的命令。

2.1. 查看所有键

keys *

下面插入了 3 对字符串类型的键值对:

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> set java jedis
OK
127.0.0.1:6379> set python redis-py
OK

命令会将所有的键输出:

127.0.0.1:6379> keys *
1) "python"
2) "java"
3) "hello"

2.2. 键总数

dbsize

下面插入一个 列表类型键值对(值是 多个元素 组成):

127.0.0.1:6379> rpush mylist a b c d e f g
(integer) 7

dbsize 命令会返回当前数据库中 键的总数

127.0.0.1:6379> dbsize
(integer) 4

dbsize 命令在 计算键总数不会遍历 所有键,而是直接获取 Redis 内置的键总数变量,所以 dbsize 命令的 时间复杂度O(1)。而 keys 命令会 遍历 所有键,所以它的 时间复杂度O(n),当 Redis 保存了 大量键 时,线上环境 禁止 使用。

2.3. 检查键是否存在

exists key

如果键存在则返回 1,不存在则返回 0

127.0.0.1:6379> exists java
(integer) 1
127.0.0.1:6379> exists not_exist_key
(integer) 0

2.4. 删除键

del key

del 是一个 通用命令,无论值是什么 数据结构 类型,del 命令都可以将其 删除

127.0.0.1:6379> del java
(integer) 1
127.0.0.1:6379> exists java
(integer) 0
127.0.0.1:6379> del not_exist_key
(integer) 0
127.0.0.1:6379> exists not_exist_key
(integer) 0

返回结果为 成功删除键的个数,假设删除一个 不存在 的键,就会返回 0

2.5. 键过期

expire key seconds

Redis 支持对 添加 过期时间,当超过过期时间后,会 自动删除键,例如为键 hello 设置 10 秒过期时间:

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> expire hello 10 
(integer) 0

ttl 命令会返回键的 剩余过期时间,它有 3 种返回值:

  • 大于等于 0 的整数:表示键 剩余过期时间
  • 返回 -1 没设置 过期时间
  • 返回 -2 不存在。

可以通过 ttl 命令观察 hello剩余过期时间

# 还剩7秒
127.0.0.1:6379> ttl hello(integer) 
(integer) 7
...
# 还剩1秒
127.0.0.1:6379> ttl hello(integer) 
(integer) 1
# 返回结果为-2,说明键hello已经被删除
127.0.0.1:6379> ttl hello(integer) 
(integer) -2
127.0.0.1:6379> get hello
(nil)

2.6. 键的数据结构类型

type key

例如键 hello 是的值 字符串类型,返回结果为 string。键 mylist 的值是 列表类型,返回结果为 list。如果键不存在,则返回 none

127.0.0.1:6379> set a b
OK
127.0.0.1:6379> type a
string
127.0.0.1:6379> rpush mylist a b c d e f g
(integer) 7
127.0.0.1:6379> type mylist
list

3. 数据结构和内部编码

type 命令实际返回的就是当前 数据结构类型,它们分别是:string字符串)、hash哈希)、list列表)、set集合)、zset有序集合),但这些只是 Redis 对外的 数据结构。如图所示:

对于每种 数据结构,实际上都有自己底层的 内部编码 实现,而且是 多种实现。这样 Redis 会在合适的 场景 选择合适的 内部编码,如图所示:

可以看到,每种 数据结构 都有 两种以上内部编码实现。例如 list 数据结构 包含了 linkedlistziplist 两种 内部编码。同时有些 内部编码,例如 ziplist,可以作为 多种外部数据结构 的内部实现,可以通过 object encoding 命令查询 内部编码

127.0.0.1:6379> object encoding hello
"embstr"
127.0.0.1:6379> object encoding mylist
"quicklist"

可以看到键 hello 对应值的 内部编码embstr,键 mylist 对应值的 内部编码ziplist

Redis 这样设计有两个好处:

  • 其一:可以改进 内部编码,而对外的 数据结构命令 没有影响。例如 Redis3.2 提供的 quicklist,结合了 ziplistlinkedlist 两者的优势,为 列表类型 提供了一种 更加高效内部编码实现

  • 其二:不同 内部编码 可以在 不同场景 下发挥各自的 优势。例如 ziplist 比较 节省内存,但是在列表 元素比较多 的情况下,性能 会有所 下降,这时候 Redis 会根据 配置,将列表类型的 内部实现 转换为 linkedlist

4. 单线程架构

Redis 使用了 单线程架构I/O 多路复用模型 来实现 高性能内存数据库服务。那为什么 单线程 还能这么快,下面分析原因:

4.1. 纯内存访问

Redis 将所有数据放在 内存 中,内存的 响应时长 大约为 100 纳秒,这是 Redis 达到 每秒万级别 访问的重要基础。

4.2. 非阻塞I/O

Redis 使用 epoll 作为 I/O 多路复用技术 的实现,再加上 Redis 自身的 事件处理模型epoll 中的 连接读写关闭 都转换为 事件,从而不用不在 网络 I/O 上浪费过多的时间,如图所示:

4.3. 单线程避免线程切换和竞态产生的消耗

采用 单线程 就能达到如此 高的性能,那么不失为一种不错的选择,因为 单线程 能带来几个好处:

  • 单线程 可以简化 数据结构和算法 的实现,开发人员不需要了解复杂的 并发数据结构

  • 单线程 避免了 线程切换竞态 产生的消耗,对于服务端开发来说,锁和线程切换 通常是性能杀手。

单线程 的问题:对于 每个命令执行时间 是有要求的。如果某个命令 执行过长,会造成其他命令的 阻塞,对于 Redis 这种 高性能 的服务来说是致命的,所以 Redis 是面向 快速执行 场景的数据库。

小结

本文堆 Redis 的几种 数据结构 进行了概述,介绍了几个简单的 全局命令数据结构内部编码 以及 单线程命令 处理机制分析。

参考

《Redis 开发与运维》


欢迎关注技术公众号: 零壹技术栈

零壹技术栈

本帐号将持续分享后端技术干货,包括虚拟机基础,多线程编程,高性能框架,异步、缓存和消息中间件,分布式和微服务,架构学习和进阶等学习资料和文章。