通过Redis学习事件驱动设计

01

为什么我说C程序员都要阅读Redis源码

主要原因就是『简洁』。如果你用源码编译过Redis,你会发现十分轻快,一步到位。其他语言的开发者可能不会了解这种痛,作为C/C++程序员,如果你源码编译安装过Nginx/Grpc/Thrift/Boost等开源产品,你会发现有很多依赖,而依赖也有自己的依赖,十分苦恼。通常半天一天就耗进去了。由衷地羡慕 npm/maven/pip/composer/...这些包管理器。而Redis则给人惊喜,一行make了此残生。

除了安装过程简洁,代码也十分简洁。使用纯C语言编写,每个模块功能都划分的很清晰。

废话不多说,本文要介绍的是Redis里的事件处理功能,与Memcache引入libevent这一臃肿的事件库不同,Redis自己实现了一个小型轻量的事件驱动库——AE。阅读它的源码是一次非常好的学习体验。

02

干净整齐的跨平台兼容

文件名说明ae.h/ae.c主要文件,根据OS平台的不同依赖以下不同文件:

文件

平台

ae_epoll.c

Linux平台

ae_kqueue.c

BSD平台

ae_evport.c

Solaris平台

ae_select.c

其他Unix平台

虽然源码文件看起来不少,但是实际上ae_epoll.c、 ae_kqueue.c、 ae_evport.c、 ae_select.c 这4个文件的功能是完全一样的,提供一致的API接口,给ae.c文件调用。这是由于实现高性能的事件驱动的API(称之为polling API)不存在ANSI或POSIX的标准,不同的OS内核有着自己的实现。比如Linux内核的epoll,BSD内核中的kqueue。 ae.c中有:

#ifdef HAVE_EVPORT
#include "ae_evport.c"
#else
    #ifdef HAVE_EPOLL
    #include "ae_epoll.c"
    #else
        #ifdef HAVE_KQUEUE
        #include "ae_kqueue.c"
        #else
        #include "ae_select.c"
        #endif
    #endif
#endif

请注意这里include的都是源文件,而非头文件。为什么这样?大家可以自己思考一下。

这些HAVE的宏,都是由在config.h中定义的。依据不同的操作系统,引入这4个文件中的某一个。从功能上来说,这样设计的目的与GOF设计模式中“适配器模式”(修改成一致接口)或“外观模式”(抽象复杂接口为简单接口)的思想类似,但实际上我个人感觉更类似于《POSA》(卷二)中提到的“包装门面模式”(Wrapper Facade)。Anyway,这个编程思想值得学习。

03

aeEventLoop:用C++去设计,用C编码

十几年前,以Linux之父炮轰C++为开端,社区内展开了一场C与C++孰是孰非的论战。而在国内,以原CSDN总编刘江援引此文为始,把战火烧到了国内。孟岩、云风、pongba几位大佬都身陷其中。后来以孟岩的一句『用C设计,用C++编码』在国内为这场论战定下基调。

反观Redis,他是纯C编码,但是融入了面向对象的思想。和上述观点截然相反,可谓是『用C++去设计,用C编码』。当然本文目的并非挑起语言之争,各种语言自有其利弊,开源项目的语言选择也主要是由于项目作者的个人经历和主观意愿。

定义在ae.h中的结构体 aeEventLoop 是AE库中最核心的数据结构,并且它采用了面向对象的设计思想:ae.h 中声明了多个函数,其第一个参数都是一个aeEventLoop指针,用于操纵aeEventLoop结构体。 从这个角度来说,可以将该结构体理解为面向对象语言中的类,而操纵它的函数则可以视为其成员函数。(其实C++的class编译之后大概也是类似的模式)

函数

说明

aeCreateEventLoop

初始化一个事件循环结构体(eventLoop)

aeGetSetSize

返回当前setsize的值

aeResizeSetSize

改变setsize的值(重新分配空间)

aeDeleteEventLoop

删除事件循环,释放内存空间

aeStop

停止事件循环,即stop值设为1

aeProcessEvents

ae核心:事件处理逻辑

aeMain

启动事件循环,事件循环的入口

aeSetBeforeSleepProc

注册回调函数,每次主循环在休眠前被调用

aeCreateEventLoopaeDeleteEventLoop 可以视为“类”aeEventLoop的构造和析构函数,其他为成员函数。

在程序中调用AE库的时候,一般是依次调用:

  1. aeCreateEventLoop
  2. 给EventLoop注册文件事件or时间事件
  3. aeSetBeforeSleepProc
  4. aeMain
  5. aeDeleteEventLoop

3-1

AE的两种事件

事件处理,是有别于多线程/多进程的并发模型。我也都知道Redis是单线程的。它的性能主要依靠异步事件处理功能来实现。虽然事件处理通常和网络编程混作一谈,但其实事件处理本身不一定是为网络编程服务的,它主要是服务于IO,网络通信是IO,文件读写同样是。当然Unix中万物皆文件了,socket也是一种fd。

AE支持两种事件:

  1. 文件事件(IO)
  2. 时间事件(毫秒级)

这两种事件都作为aeEventLoop的结构体成员存在。 aeEventLoop各成员说明:

typedef struct aeEventLoop {
    int maxfd;                      /* 当前注册的最大fd */
    int setsize;                    /* 监视的fd的最大数量 */
    long long timeEventNextId;      /* 下一个时间事件的ID */
    time_t lastTime;                /* 上次时间事件处理时间 */
    aeFileEvent *events;            /* 已注册文件事件数组 */
    aeFiredEvent *fired;            /* 就绪的文件事件数组 */
    aeTimeEvent *timeEventHead;     /* 时间事件链表的头 */
    int stop;                       /* 是否停止(0:否;1:是)*/
    void *apidata;                  /* 各平台polling API所需的特定数据 */
    aeBeforeSleepProc *beforesleep; /* 事件循环休眠开始的处理函数 */
    aeBeforeSleepProc *aftersleep;  /* 事件循环休眠结束的处理函数 */
} aeEventLoop;

文件事件,主要依靠两个数组。一个是注册的文件事件数组,一个是已就绪的文件事件数组。

typedef struct aeFileEvent {
    int mask; /* one of AE_(READABLE|WRITABLE|BARRIER) */
    aeFileProc *rfileProc;
    aeFileProc *wfileProc;
    void *clientData;
} aeFileEvent;
typedef struct aeFiredEvent {
    int fd;
    int mask;
} aeFiredEvent;

单词Fired有通知的意思,在这里你可以理解为“就绪”

每个文件事件,其读写设置了不同的处理函数。另外mask表示事件的触发类型。当每次polling API返回就绪之后(比如epoll_wait返回),就绪会被设置到aeFireEvent,然后反查aeFileEvent获得处理函数并处理。你会发现aeFileEvent结构体里并没有记录fd。其实这是使用了HASH策略,aeEventLoop的成员 aeFileEvent数组的下标即是fd,便于快速查找。

时间事件,本质就是定时器任务,其数据结构采用一个双向链表。链表每个结点为aeTimeEvent结构体,主要包含事件的ID(递增)、就绪的时间,处理函数、清理函数、客户数据。

typedef struct aeTimeEvent {
    long long id; /* time event identifier. */
    long when_sec; /* seconds */
    long when_ms; /* milliseconds */
    aeTimeProc *timeProc;
    aeEventFinalizerProc *finalizerProc;
    void *clientData;
    struct aeTimeEvent *prev;
    struct aeTimeEvent *next;
} aeTimeEvent;

每个事件循环中,每个时间事件的ID唯一且递增,主要依赖aeEventLoop里的timeEventNextId来维护这个ID的递增关系。创建新的时间事件时(aeCreateTimeEvent)会赋值,由于只考虑了单线程,所以没有加锁逻辑,大家也不要贸然把AE用在多线程环境中。

when_sec和 when_ms 记录了时间事件的就绪时间(秒+毫秒),即当当前时间大于等于这个时间的时候,该时间事件应被处理。

时间事件的处理过程(processTimeEvents)主要就是:继续遍历链表,如果发现节点状态为AE_DELETED_EVENT_ID则删除该节点。如果判断当前时间已经超过节点的就绪时间就开始处理。处理函数的返回值可以指定,后续不再处理该事件(NOMORE),则该节点会被置为AE_DELETED_EVENT_ID。如果下次还需要处理,则更新该节点的时间为下次就绪时间。

3-2

事件循环的处理逻辑

再用一张图,回顾一下EventLoop中的两种事件,基本可以做如下理解。一个链表,一个数组。文件事件中的数组不是线性填满的,因为是采用的HASH策略,将fd作为数组下标了。

aeProcessEvents 是aeEventLoop在循环过程中的的实际处理逻辑。函数原型如下:

int aeProcessEvents(aeEventLoop *eventLoop, int flags);

flags标记,表示本次需要处理的事件类型标记和是否阻塞标记。

标记位

含义

AE_TIME_EVENTS

时间事件标记

AE_FILE_EVENTS

文件事件标记

AE_DONT_WAIT

立即返回不阻塞等待的标记

aeProcessEvents 具体实现代码我就不贴了。它巧妙的地方是一次柔和了文件和时间事件的两种处理过程。在函数之初,会查找时间事件的链表,找到最近就绪时间事件,然后用它的就绪时间减去当前时间的时间差作为 polling API 的休眠时间(epoll_wait的timeout参数)。然后休眠等待polling api返回。在返回之后先执行aftersleep的的处理逻辑,然后执行这段休眠时间内就绪的文件事件,最后再处理就绪的时间事件。返回值是处理过的事件总数。

也就说AE会尽量在一次处理过程中,将时间事件和文件事件一次性处理。你也许会问如果没有时间事件怎么办。当然没关系,在aeProcessEvents开始部分就根据标记位进行了判断。上面的逻辑是在文件事件和时间事件都存在的情况下,如果仅存在文件事件,则看是否设置了不阻塞的标记(AE_DONT_WAIT),若有,则polling 的超时时间设置为0。如无,即可以阻塞,则设置为-1,则polling API会阻塞直到有文件事件发生。

04

ae_epoll:Linux上epoll的封装

前文说道Redis适配各种Unix-like的操作系统。它将内核强相关的事件API(polling API)部分单独抽出来,包装出了相同的接口给AE的对外API调用。在Linux系统上的API实现为:ae_epoll.c,建议在阅读这个文件源码之前先好好回顾一下epoll的API,这样更助于快速理解。相信工作后大家写业务逻辑,应该很少接触epoll了。可以阅读这个wik,快速回顾epoll的api:LinuxAPI:epoll

ae_epoll.c 完全被 ae.c调用。各函数调用关系如下(aeApi开头的都是ae_epoll.c中的函数): ae.c

  • aeCreateEventLoop
    • aeApiCreate
  • aeResizeSetSize
    • aeApiResize
  • aeDeleteEventLoop
    • aeApiFree
  • aeCreateFileEvent
    • aeApiAddEvent
  • aeDeleteFileEvent
    • aeApiDelEvent
  • aeProcessEvent
    • aeApiPoll
  • aeGetApiName
    • aeApiName

除了aeApiName()以外,其他函数第一个参数也都是aeEventLoop * 。用面向对象的思想来看这也是aeEventLoop的成员函数。试想若是C++,则可能会被处理成父子两个类,而aeApi系列的函数是纯虚的。 aeApi的函数也是可以做到顾名即可思义。比如:

  • aeApiCreate在堆上进行内存的分配,封装epoll_create创建epfd,并写入aeEventLoop。
  • aeApiAddEvent、aeApiDelEvent是封装的epoll_ctl来对aeEventLoop的监控的epoll事件进行添加和删除。
  • aeApiPoll是封装的epoll_wait开启事件循环,并且每次取出就绪的fd存入aeEventLoop的fired数组中,并置位相应的mask(读or写)
  • aeApiResize、aeApiFree分别进行的是内存的重分配、资源的清理(关闭epfd,free内存)和epoll本身关联不大。

05

Jim:AE的缘起

阅读完AE代码,可能只需要一下午的时间,你会惊叹于作者的设计功力。其实里面也没有太多花哨的东西,但就是如此简洁清晰的给你呈现了一个完成度如此之高的事件驱动处理库。但我想即使大家都熟悉epoll、熟悉kqueue、熟悉数据结构也不一定能设计出来AE,所以把程序员比作代码的设计师、建筑师是丝毫不为过的。

AE的设计灵感其实也是受另外一个开源项目影响,它就是 Jim。

Redis的ae.c的开篇注释中就已注明:

A simple event-driven programming library. 
Originally I wrote this code for the Jim's event-loop (Jim is a Tcl interpreter)
but later translated it in form of a library for easy reuse.
 

Redis作者说他最初是为了Jim项目的事件驱动功能编写了一套代码,后来将其改造成了一个易于复用的库。

所以AE其实可以脱离Redis而存在。这种松耦合,是一种设计的魅力。

Jim的源码在Github上有它的镜像,其中事件循环的代码在此:

https://github.com/msteveb/jimtcl/blob/master/jim-eventloop.c

快速阅读一下Jim的代码,AE整体处理逻辑确实与Jim相似。但AE也不乏创新,比如抽象出polling API这层,达到了多平台的兼容和解耦,而Jim则强耦合了select。

我们常说『站在巨人的肩膀』,虽然Jim不是巨人,但作者通过为他编写代码,从而启发了AE,即使Jim最终被世人遗忘,而它的血肉也化作了土壤,滋养后来人,这就是开源运动的意义所在,也是魅力所在。学习的本质,其实就是模仿,然后改进,这不是抄袭,这是传承。

原文地址:https://cloud.tencent.com/developer/article/1915048

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


学习编程是顺着互联网的发展潮流,是一件好事。新手如何学习编程?其实不难,不过在学习编程之前你得先了解你的目的是什么?这个很重要,因为目的决定你的发展方向、决定你的发展速度。
IT行业是什么工作做什么?IT行业的工作有:产品策划类、页面设计类、前端与移动、开发与测试、营销推广类、数据运营类、运营维护类、游戏相关类等,根据不同的分类下面有细分了不同的岗位。
女生学Java好就业吗?女生适合学Java编程吗?目前有不少女生学习Java开发,但要结合自身的情况,先了解自己适不适合去学习Java,不要盲目的选择不适合自己的Java培训班进行学习。只要肯下功夫钻研,多看、多想、多练
Can’t connect to local MySQL server through socket \'/var/lib/mysql/mysql.sock问题 1.进入mysql路径
oracle基本命令 一、登录操作 1.管理员登录 # 管理员登录 sqlplus / as sysdba 2.普通用户登录
一、背景 因为项目中需要通北京网络,所以需要连vpn,但是服务器有时候会断掉,所以写个shell脚本每五分钟去判断是否连接,于是就有下面的shell脚本。
BETWEEN 操作符选取介于两个值之间的数据范围内的值。这些值可以是数值、文本或者日期。
假如你已经使用过苹果开发者中心上架app,你肯定知道在苹果开发者中心的web界面,无法直接提交ipa文件,而是需要使用第三方工具,将ipa文件上传到构建版本,开...
下面的 SQL 语句指定了两个别名,一个是 name 列的别名,一个是 country 列的别名。**提示:**如果列名称包含空格,要求使用双引号或方括号:
在使用H5混合开发的app打包后,需要将ipa文件上传到appstore进行发布,就需要去苹果开发者中心进行发布。​
+----+--------------+---------------------------+-------+---------+
数组的声明并不是声明一个个单独的变量,比如 number0、number1、...、number99,而是声明一个数组变量,比如 numbers,然后使用 nu...
第一步:到appuploader官网下载辅助工具和iCloud驱动,使用前面创建的AppID登录。
如需删除表中的列,请使用下面的语法(请注意,某些数据库系统不允许这种在数据库表中删除列的方式):
前不久在制作win11pe,制作了一版,1.26GB,太大了,不满意,想再裁剪下,发现这次dism mount正常,commit或discard巨慢,以前都很快...
赛门铁克各个版本概览:https://knowledge.broadcom.com/external/article?legacyId=tech163829
实测Python 3.6.6用pip 21.3.1,再高就报错了,Python 3.10.7用pip 22.3.1是可以的
Broadcom Corporation (博通公司,股票代号AVGO)是全球领先的有线和无线通信半导体公司。其产品实现向家庭、 办公室和移动环境以及在这些环境...
发现个问题,server2016上安装了c4d这些版本,低版本的正常显示窗格,但红色圈出的高版本c4d打开后不显示窗格,
TAT:https://cloud.tencent.com/document/product/1340