谁说php不能搞长连接?

3,410 阅读3分钟
原文链接: mp.weixin.qq.com

据说,php是世界上最好的语言?

画外音:phper说,不服可以点赞来辩。

如果站点架构满足以下几点:

  • 使用php这类脚本语言开发

  • 需要连接后端服务,例如RPC服务、memcache、redis等

  • 流量非常大

此时,通过短连接访问RPC服务、mc、redis会出现什么问题呢?

典型的web架构如上:(1) 最前端是APP或者web页面;(2) 服务器上层是web-server进行接入;(3) php调用后端,完成业务逻辑,拼接页面;(4) 最后端是服务、缓存、数据库;

php作为脚本语言,不像C++/Java那样进程常驻,所以它连接后端的服务都是使用短连接。

画外音:有朋友说,可以用C写扩展?

上图是一种典型场景,站点php部署在机器A上,缓存memcache部署在机器B上,之间通过短连接通信,过程为:(1) php建立tcp短连接;(2) 按照memcache协议发送数据;(3) 接收memcache返回的数据;(4) php关闭tcp短连接;

在流量小时,上述过程没有任何问题,当网站流量非常大的情况下,短连接可能会成为性能瓶颈,有什么优化办法吗?

画外音:建立连接,销毁连接很耗时。

话锋一转,什么是UNIX Domain Socket UNIX Domain Socket是一种IPC机制,它不需要经过网络协议栈,不需要打包拆包、计算校验和、维护序号和应答等,只是将应用层数据从一个进程拷贝到另一个进程。

画外音:IPC, Inter-Process Communication, 进程间通信。

它可以用于同一台主机上两个没有亲缘关系的进程,并且是全双工的,提供可靠消息传递(消息不丢失、不重复、不错乱)的IPC机制。

画外音:亲缘关系是指,父子进程或者兄弟进程这种“特殊的”进程关系。

可以看到,UNIX Domain Socket的效率会远高于tcp短连接,但它只能用于同一台主机间的进程通讯,而php应用和后端服务往往是部署在不同的机器上的,此时能否利用它来进行优化呢?

优化后的简易架构图如上:

(1) 在php应用服务器上部署一个local-proxy;

(2) php与local-proxy之间使用UNIX Domain Socket来通讯;

(3) local-proxy与后端服务进行TCP长连接通讯;

这样就大大提升了通讯效率,免除了每次请求都要进行的建立与关闭tcp短连接的开销。

实现local-proxy有什么要注意的?

local-proxy非常注重通用性设计,因为php有RPC、mc、redis等多种后端:

  • 协议设计:local-proxy本身没有任何业务逻辑,只负责请求转发,上游发送过来redis协议,透传给后端的redis

画外音:这样,上游客户端不需要进行任何代码修改。

  • 通讯方式:如上文所述,local-proxy与上游使用UNIX Domain Socket进行通讯,与下游使用tcp长连接进行通信

  • 高效框架:这种方案是为了解决tcp短连接的效率损耗,这样对local-proxy的效率要求就非常高,可以选用成熟高效的网络框架和tcp长连接连接池技术来实现

画外音:例如libevent。

  • 请求映射:需要将上游发过来的请求与发往下游的请求一一映射起来,这样才能正确的对应上请求包与响应包

思考过程比结论重要,希望对你有启示。

架构师之路-分享可落地的技术文章

相关推荐:

Google FileSystem架构启示

Google MapReduce到底解决什么问题?

Google BigTable到底解决什么问题?