来源:程序员老廖

功能概览

  • 用户注册/登录:用户名+密码注册,MySQL 存储,INSERT IGNORE 原子去重

  • Token 认证:登录后 Redis 存储 token,1 小时过期

  • WebSocket 实时聊天:RFC 6455 完整实现,支持文本帧、Ping/Pong、Close

  • 消息持久化:Redis List 存储最近 200 条聊天记录

  • 历史消息推送:WebSocket 连接建立后推送最近 50 条历史消息

  • 全员广播:消息实时推送给所有在线 WebSocket 客户端

  • HTTP Keep-Alive:复用 TCP 连接减少开销

  • 嵌入式前端:商业 IM 风格 UI,左右分栏布局,彩色头像,连接状态指示器,响应式适配

系统架构

整体架构

线程模型

数据流

用户注册流程

WebSocket 聊天消息流程

文件结构与模块职责

chatapp/
|
+-- coro_net.h 核心协程网络层
| |-- FireAndForget 协程返回类型,启动即忘
| |-- Worker epoll 事件循环 + 协程句柄管理 + 跨线程调度
| |-- AsyncRead 异步 socket 读 awaiter
| |-- AsyncWrite 异步 socket 写 awaiter
| +-- SwitchToWorker 跨线程切换 awaiter
|
+-- async_redis.h Redis 异步访问层
| |-- RedisAwaiter Redis 命令结果容器
| |-- WorkerRedis hiredis-async 适配器,集成 Worker epoll
| +-- AsyncRedisCommand co_await Redis 命令 awaiter
|
+-- async_mysql.h MySQL 异步访问层
| |-- ThreadPool 通用线程池,条件变量调度
| |-- MySQLPool MySQL 连接池,阻塞 acquire/release
| |-- MySQLResult SQL 查询结果
| |-- AsyncMySQLQuery co_await SQL 执行 awaiter
| +-- mysql_escape SQL 参数转义
|
+-- http_server.h HTTP 协议层
| |-- HttpRequest 请求解析:方法、路径、头、body、JSON、Cookie
| |-- HttpResponse 响应构建:状态码、头、body、JSON、重定向
| +-- json_escape JSON 字符串转义
|
+-- websocket.h WebSocket 协议层
| |-- ws_crypto SHA1 + Base64 握手算法
| |-- WSOpcode 帧类型枚举
| |-- WSFrame 帧结构
| |-- ws_encode_frame 服务端帧编码,无 mask
| |-- WSClient 在线客户端信息
| +-- WSManager 连接管理器,广播
|
+-- chat_page.h 嵌入式前端页面(从 chat_app.h 分离)
| +-- HTML_PAGE 商业 IM 风格前端(左右分栏、彩色头像、连接状态)
|
+-- chat_app.h 业务逻辑层
| |-- generate_token 随机 token 生成
| |-- hash_password FNV-1a 密码哈希
| |-- handle_http_conn HTTP/WebSocket 主协程
| +-- 路由处理 注册/登录/发消息/获取消息/WebSocket
|
+-- main.cpp 入口
| |-- worker_thread Worker 线程函数
| |-- init_mysql_tables 建表
| +-- main 参数解析、初始化、accept 循环
|
+-- Makefile 编译脚本
+-- benchmark.cpp HTTP 压测工具
+-- ws_bench.cpp WebSocket 压测工具
+-- bench_layers.cpp 分层性能测试
+-- bench_pool.sh 连接池参数调优脚本
+-- test_ws.py WebSocket 功能测试脚本

项目源码:C++20协程项目-高并发Web聊天室,包括协程如何调用MySQL+Redis

核心设计详解

协程网络层 coro_net.h

这是整个系统的基石,将 epoll 事件驱动与 C++20 协程无缝结合。

FireAndForget —— 协程返回类型

class FireAndForget {
     struct promise_type {
          FireAndForget get_return_object() { return {}; }
          std::suspend_never initial_suspend() { return {}; } // 创建即启动
          std::suspend_never final_suspend() noexcept { return {}; } // 结束不挂起
          void return_void() {}
          void unhandled_exception() { std::terminate(); }
    };
};

FireAndForget 是一种 "启动即忘" 的协程。协程创建后立即开始执行( initial_suspend 返回

suspend_never ),执行完成后自动销毁( final_suspend 返回 suspend_never )。调用者不需要管理协程生命周期。

这种设计适用于 "每连接一个协程" 的模型:accept 后创建协程,协程自己管理 fd 的整个生命周期。

Worker —— epoll 事件循环

Worker 是系统的核心调度器,每个 Worker 在独立线程上运行,管理:

  1. epoll 事件循环:处理 socket IO 事件

  2. 协程句柄映射:fd → coroutine_handle 的映射表

  3. ready_events 缓存:处理事件到达但协程未注册 handle 的时序窗口

  4. 跨线程唤醒:eventfd 机制,支持从任意线程唤醒 Worker

  5. 自定义 FdHandler:支持 hiredis-async 等第三方库注册自己的 fd 处理逻辑

AsyncRead/AsyncWrite —— 异步 IO Awaiter

关键优化: await_ready 的先尝试读取(fast path)避免了在数据已就绪时不必要的 suspend/resume 开销。高吞吐场景下,大部分 IO 操作可以在 await_ready 中直接完成。

Redis 异步访问 async_redis.h

Redis 使用 hiredis-async 库,与 Worker 的 epoll 深度集成。

每 Worker 一个 Redis 连接的设计:

  • Redis 协议天然支持 pipeline —— 多个命令可以在一个 TCP 连接上交错发送

  • hiredis-async 内部维护命令队列,自动 pipeline

  • 一个连接即可服务该 Worker 上的所有协程,无需连接池

MySQL 异步访问 async_mysql.h

MySQL C API ( libmysqlclient ) 是同步阻塞的,无法直接集成到 epoll。解决方案:线程池 + 连接池 + 协程挂起。

关键设计决策:

1. 为什么不用 MySQL 非阻塞 API?

  • MySQL C API 的非阻塞模式需要 mysql_real_connect_nonblocking 等函数,API 复杂且文档不足

  • MariaDB Connector/C 的非阻塞 API 与 MySQL 不兼容

  • 线程池方案简单可靠,性能损失可控

2. 连接池大小如何选择?

  • 连接数 = min(CPU 核数 x 2, 并发协程数)

  • 8-16 连接已足够饱和大部分场景(MySQL IO 本身是瓶颈)

  • 连接过多反而增加 MySQL 内部锁竞争

3. 协程如何不阻塞 Worker 线程?

  • await_suspend 把 SQL 任务提交到 ThreadPool 后立即返回

  • Worker 线程可以继续处理其他协程的 IO 事件

  • SQL 执行完成后通过 worker->schedule + eventfd 唤醒 Worker

HTTP 协议层 http_server.h

实现了 HTTP/1.1 的核心子集:

  • 请求解析:方法、路径、Query String、Headers、Body、JSON 提取

  • 响应构建:状态码、Headers、Content-Length 自动计算

  • Keep-Alive:通过 Connection header 判断是否复用连接

  • 无第三方依赖:手写解析器,约 230 行代码

WebSocket 协议层 websocket.h

完整实现 RFC 6455 WebSocket 协议:

WebSocket 帧格式 (RFC 6455 Section 5.2):

Opcode

类型

用途

0x1

Text frame

聊天消息

0x8

Close frame

关闭连接

0x9

Ping frame

保活检测

0xA

Pong frame

Ping 响应

客户端→服务端:必须 mask(4 字节 XOR 密钥)

服务端→客户端:不能 mask

WSManager —— 连接管理与广播

class WSManager {
    map<int, WSClient> clients_; // fd -> client info
    mutex mu_;

    void broadcast(const string& message) {
        string frame = ws_encode_frame(WS_TEXT, message);
        lock_guard lock(mu_);
        for (auto& [fd, client] : clients_) {
          ::write(fd, frame.data(), frame.size()); // 同步写
       }
    }
};

业务逻辑层 chat_app.h

前端 UI 架构

嵌入式前端采用商业 IM 风格设计,参考微信 Web / Telegram 等产品的交互范式:

配色方案:

元素

颜色

说明

主色调

#07c160

微信绿

背景色

#f0f0f0

浅灰

侧边栏

#2e2e2e

深色

自己的气泡

#95ec69

绿色

他人的气泡

#ffffff

白色

前端特性:

特性

实现方式

彩色头像

根据用户名哈希从 12 色板选色,首字母大写显示

消息气泡

自己绿色右对齐,他人白色左对齐,微信同款圆角

连接状态

绿色/红色/橙色闪烁圆点,实时反映 WebSocket 状态

多行输入

textarea 自动扩展高度,Shift+Enter 换行,Enter 发送

响应式布局

768px 以下侧边栏隐藏,通过汉堡菜单切换显示

断线重连

WebSocket 断开后 2 秒自动重连,状态指示器联动

侧边栏预览

最新消息自动更新到聊天室描述区域

核心协程生命周期

handle_http_connection 是系统的核心协程,管理单个 TCP 连接的完整生命周期:

协程并发模型

本项目采用 "每个连接一个协程" 的并发模型。每当主线程 accept 一个新的客户端 TCP 连接时,就会创建一个独立

的 handle_http_connection 协程实例。该协程独立管理这个连接的完整生命周期:从读取 HTTP 请求、路由分

发、到 WebSocket 消息循环、最终关闭连接。

一个连接 = 一个协程

关键特征:

  • 每个连接独立:协程 A 的 co_await AsyncRead 挂起时,Worker 线程立刻去执行协程 B 的就绪操作,不会阻塞

  • M:N 映射:M 个协程映射到 N 个 Worker 线程。当前默认 N=4,可支撑 10,000+ 并发连接

  • 连接亲和性:一个协程从创建到销毁始终在同一个 Worker 线程上运行,不跨线程迁移

FireAndForget —— 启动即忘的协程生命周期

handle_http_connection 的返回类型是 FireAndForget ,这并不意味着"发出去就不管了",而是 "调用者不需要 co_await 等待它完成" 。协程创建后自行运行,直到连接关闭时自动销毁:

协程调度全景图

与其他并发模型的对比

模型

并发方式

10K 连接开销

代码风格

缺点

每连接一个线程

OS 线程

~80GB 栈内存

同步、直观

线程数受限,上下文切换重

事件回调

回调函数

极低

回调嵌套、状态机

可读性差,错误处理复杂

每连接一个协程

协程 + epoll

~几十 MB

同步风格,异步执行

需要编译器支持 C++20

本项目的协程模型兼具了线程的 代码可读性 和事件驱动的 性能。每个连接的处理逻辑看起来就像普通的顺序代 码,但在 co_await 处自动让出执行权,让 Worker 线程去服务其他连接。

请求处理全流程

HTTP 请求处理流程

用户注册流程

为什么用 INSERT IGNORE 而不是 SELECT + INSERT?

  • 原子性:没有检查和插入之间的竞态条件

  • 单次 SQL:一次往返替代两次

  • +88% QPS:从 5.4K 提升到 10.1K

用户登录流程

WebSocket 建连流程

WebSocket 消息流程

协程调度机制

Worker 事件循环

AsyncRead/AsyncWrite 原理

三阶段协议:

为什么要在 await_ready 中先尝试 syscall?

高吞吐场景下,TCP 接收缓冲区经常有数据,try-first 可以跳过整个 suspend/resume 流程。

跨线程调度 SwitchToWorker

ready_events 缓存机制与 Bug 修复

问题场景

Stale ready_events Bug
======================

Timeline:

t0: Main thread accept(fd=37), add_client_fd(37, EPOLLIN|EPOLLET)
    Data is already in TCP buffer (client sent HTTP request)

t1: Worker epoll_wait returns EPOLLIN for fd=37
    But handles_[37] is nullptr (coroutine hasn't registered yet)
    --> ready_events_[37] = EPOLLIN (cached!)

t2: Coroutine starts, first AsyncRead:
    await_ready: ::read(37) succeeds! returns data
    --> return true (no suspend needed)
    --> ready_events_[37] is NOT cleared

t3: ... HTTP processing, WebSocket handshake ...

t4: WebSocket msg loop, AsyncRead for new frame:
    await_ready: ::read(37) returns EAGAIN (no data)
    --> return false, proceed to await_suspend

t5: await_suspend -> set_client_handle(37, h)
    Worker finds ready_events_[37] has EPOLLIN
    --> immediately resume coroutine!

t6: await_resume: ::read(37) returns -1 (EAGAIN!)
    --> return -1

t7: WebSocket loop: if (n <= 0) break;
    --> Connection closed! BUG!

修复方案

bool await_ready() {
    result_ = ::read(fd_, buf_, len_);
    if (result_ >= 0 || (errno != EAGAIN && errno != EWOULDBLOCK)) {
        // 读取成功,清除可能残留的 stale ready_events
        if (t_worker) t_worker->clear_ready_events(fd_);
        return true;
    }
    return false;
}

同时在 WebSocket 消息循环中增加 EAGAIN 防御性重试:

ssize_t n;
do {
    n = co_await AsyncRead(client_fd, (char*)header, 2);
} while (n < 0 && (errno == EAGAIN || errno == EWOULDBLOCK || errno == EINTR));
if (n <= 0) break;

双层防御:

  1. clear_ready_events 从根源消除 stale 缓存

  2. EAGAIN 重试作为额外保险

连接复用策略

Redis:每 Worker 一个 hiredis-async 连接

为什么不用连接池?

Redis 单线程处理命令,pipeline 已达最大吞吐

多连接到同一 Redis 实例不会提升性能

一个连接简化了管理,减少了资源消耗

MySQL:全局连接池 + 线程池

为什么不直接在协程中使用 MySQL?

  • MySQL C API 是同步阻塞的,会阻塞整个 Worker 线程

  • 一个被阻塞的 Worker 线程意味着该 Worker 上的所有协程都停止调度

  • 线程池隔离了阻塞操作,Worker 线程永远不会被 MySQL 阻塞

编译与运行

依赖安装

sudo apt install g++ libhiredis-dev libmysqlclient-dev redis-server mysql-server

数据库准备

mysql -u root -e "
CREATE DATABASE IF NOT EXISTS chatapp CHARACTER SET utf8mb4;
CREATE USER IF NOT EXISTS 'chatuser'@'localhost' IDENTIFIED BY 'chatpass';
GRANT ALL PRIVILEGES ON chatapp.* TO 'chatuser'@'localhost';
FLUSH PRIVILEGES;
"

编译

make # 编译 chatserver, benchmark, ws_bench
make clean # 清理

运行

./chatserver --port 9090 --workers 4 --mysql-user chatuser --mysql-pass chatpass

浏览器访问 http://127.0.0.1:9090

完整参数

./chatserver [options]
--port N HTTP 端口 (默认: 8080)
--workers N Worker 线程数 (默认: 4)
--redis-host H Redis 地址 (默认: 127.0.0.1)
--redis-port N Redis 端口 (默认: 6379)
--mysql-host H MySQL 地址 (默认: 127.0.0.1)
--mysql-port N MySQL 端口 (默认: 3306)
--mysql-user U MySQL 用户 (默认: root)
--mysql-pass P MySQL 密码 (默认: 空)
--mysql-db D MySQL 数据库 (默认: chatapp)
--mysql-pool N MySQL 连接池大小 (默认: 8)
--thread-pool N 线程池大小 (默认: 8)

性能测试

测试环境:单机,MariaDB 10.6,Redis 7.x,g++ 11.4,C++20,4 Worker 线程

HTTP 注册/登录性能

压测工具

./benchmark [options]
  -h HOST   目标地址 (默认: 127.0.0.1)
  -p PORT   目标端口 (默认: 9090)
  -t N      线程数 (默认: 4)
  -c N      每线程连接数 (默认: 1)
  -n N      总请求数 (默认: 1000)
  -m MODE   模式: register 或 login
  -k        启用 Keep-Alive

注册性能

方案

连接池

QPS

说明

纯 MySQL INSERT, 16连接直连

-

16,155

基准上限

INSERT IGNORE + HTTP + 协程

8

10,163

达到基准的 63%

INSERT IGNORE + HTTP + 协程

16

10,905

达到基准的 67%

INSERT IGNORE + HTTP + 协程

32

12,392

达到基准的 77%

登录性能

连接模式

并发连接数

QPS

短连接

64

9,259

Keep-Alive

16

9,461

Keep-Alive

32

10,493

Keep-Alive

64

10,799

WebSocket 性能

压测工具

./ws_bench [options]
  -h HOST   目标地址 (默认: 127.0.0.1)
  -p PORT   目标端口 (默认: 9090)
  -c N      并发连接数 (默认: 100)
  -n N      总消息数 (默认: 1000)
  -t N      线程数 (默认: 4)
  -m MODE   模式: connect, throughput, echo, concurrent

连接容量

并发连接数

成功率

连接速率

总耗时

50

100%

1,356 conn/s

0.15s

500

100%

2,110 conn/s

1.24s

1,000

100%

2,469 conn/s

1.96s

2,000

100%

1,949 conn/s

4.77s

5,000

100%

1,429 conn/s

12.3s

10,000

100%

3,144 conn/s

20.5s

4 Worker 线程可维护 10,000+ 并发 WebSocket 长连接。连接建立耗时主要来自 HTTP 注册/登录,WebSocket握手本身很快。

回声延迟(单发送者 + N-1 旁观者)

在线连接

成功率

P50

P90

P95

P99

Max

1

100%

0.27ms

0.27ms

0.28ms

0.28ms

1.5ms

10

100%

0.27ms

0.28ms

0.29ms

1.65ms

3.2ms

100

100%

0.79ms

1.10ms

1.38ms

2.09ms

6.3ms

500

93.8%

28.1ms

778ms

1,323ms

1,936ms

1,997ms

100 连接以内,P50 延迟 < 1ms。500 连接时广播成为瓶颈,延迟急剧上升。

消息吞吐量(发送 + 广播全接收)

连接数

消息/连接

发送 QPS

接收率

广播 QPS

总耗时

10

100

19,856

100%

2,451

4.1s

50

20

14,990

100%

3,518

14.2s

100

10

13,387

100%

3,796

26.4s

消息零丢失。发送 QPS ~15-20K,广播 QPS ~2.5-3.8K(计入 N 倍扇出)。

并发回声(多连接同时发+收)

连接数

消息总数

成功率

QPS

P50

P90

P99

Max

10

1,000

100%

20,387

0.06ms

0.29ms

0.58ms

1.9ms

50

1,000

100%

17,537

0.26ms

0.30ms

1.91ms

2.2ms

100

1,0000

100%

20,335

0.26ms

0.29ms

1.06ms

5.5ms

并发模式下 QPS 稳定在 ~20K echo/s,P50 < 0.3ms。

总结

本项目展示了 C++20 协程在实际网络应用中的完整实践:

维度

数据

代码规模

~1,500 行 C++

并发连接

10,000+ WebSocket

HTTP QPS

10K-12K 注册/s

WebSocket 延迟

P50 < 0.3ms

消息吞吐

~20K msg/s

Worker 线程

4 个

外部依赖

hiredis, libmysqlclient

协程的核心价值:用同步代码的可读性,获得异步代码的性能。

项目源码:C++20协程项目-高并发Web聊天室,包括协程如何调用MySQL+Redis

更多推荐