MQ
Message Queue (简称 MQ) 是目前微服务架构中应用非常广泛的中间件,主要用来做异步处理、服务解耦、流量削峰等。一个高性能、低延迟、高可用、高可靠的消息队列在互联网业务中是非常必要的。
而在多数互联网公司中使用的 MQ 中间件产品有:
Kafka
nakadi - A distributed event bus that implements a RESTful API abstraction on top of Kafka-like queues
allegro/hermes - Fast and reliable message broker built on top of Kafka.
RocketMQ
RabbitMQ
Pulsar
pmq
qmq
NSQ
Redis, 其实 Redis 并不能算一个 MQ 产品,它只是提供了一些 Queue 的能力,Pub/Sub 的能力
适用于 IoT 的 emqx - https://www.emqx.cn/
我们需要明白一个道理,不存在一个完美的东西可以解决所有问题,往往是在引入一个新的东西时解决了我们的痛点,但是同样会引入其他复杂度,而这个引入的复杂度是否能被接受要看具体的场景进行权衡;这个道理同样适用于 MQ,所以 MQ 不是银弹。
那么 MQ 主要解决了什么问题呢?MQ 很好的解决了耦合性问题、数据分发问题、流量激增问题,比如服务间的耦合,通常情况下服务间使用 RPC 的方式直接调用,这会带来服务间的耦合性比较大,引入 MQ 后可以利用发布-订阅模型,分离了调用方和被调用方,也就是实现了生产者和消费者;再比如我们需要将一份数据(或者一个事件)发送到多个服务中(因为我们使用了微服务架构,做了服务拆分),这个时候可以利用 MQ 解决数据分发问题;再比如在一个高并发的系统中,MQ 有缓冲数据的能力,所以对流量也有控制的能力,也就是削峰,不至于超大流量压垮系统。
此外由于 MQ 的这些能力,MQ 也被用来解决分布式事务问题,来实现数据的最终一致性:
比如事务性消息的实现,RocketMQ 就实现了事务性消息,将数据的发送分为两个阶段,第一阶段是 Prepare 阶段的 Half Message,然后是在本地事务提交或回滚后触发 Commit 阶段的提交或回滚;此外还有一个补偿机制,当 Half Message 消息在一定时间后没有收到 Commit 消息,则会反查业务系统,这样就保证了数据发送的原子性,而这种保证是最终一致性的;消息发送成功后,消息是否被消费者正确消费,依赖于消费者自己的实现
比如应用在分布式事务中,sagas 的实现可以基于 MQ 的通道来解耦合,减少服务间的直接调用,增加吞吐量和实现异步
还有在大数据的应用场景中,MQ 作为一个管道连接了数据和流计算任务,作为数据的中间存储。
当然,MQ 也会带来一些问题
MQ 增加了系统复杂度,比如 MQ 由多个 Broker 组成,肯定要解决 Broker 的可用性问题,服务发现问题、性能问题(延迟和吞吐量的权衡);再比如发送给 MQ 的消息怎么做到不丢失,这个问题很关键;再比如 MQ 可以缓冲消息,如果消息积压了要能快速解决
使用了 MQ 会把原本直接调用的方式转为异步的模式,这无形中增加了延迟,因为消息要经过 MQ 的 Broker 才能到达消费方,消费方成功消费后才能把结果反馈出来
在整个的消息处理的过程中,可能会带来数据的不一致,比如订单创建成功了,但是可能还没有生成发货的订单,但这种不一致我们是可以接受的
上面讨论了引入 MQ 带来的一些好处和一些问题,一般情况下,当我们的业务到达一定阶段的时候,这个时候大泥球式的单体架构无法满足业务发展,开发的复杂度也会日益增加,开发效率日益下降,势必会做业务服务拆分,分开治理和独立演化,此外由于数据量的增加,需要将数据分发到大数据平台做离线或者实时的分析,到达这个阶段时 MQ 就是一个非常重要基础组件,同样的我们也要承受引入 MQ 带来的问题,那么引入 MQ 会带来哪些具体的问题呢?
如何选择 MQ 产品?自研还是开源方案?为什么要这么选择?
使用 MQ 后如何应对和解决消息丢失问题?
使用 MQ,如何解决消息重复问题?
使用 MQ,如何解决消息积压问题?
使用 MQ,如何实现分布式事务?什么是事务消息?适合用在什么场景下?
MQ 的顺序消息如何保证?局部有序 or 全局有序?
针对 MQ 本身
MQ 的技术架构、部署架构等?有哪些设计亮点,适合用在什么场景下?
如何实现高可用?多副本,日志复制,自动 failover
如何实现高性能?低延迟和高吞吐的权衡
MQ 间的数据一致性
MQ 服务注册和发现
MQ 治理,消息监控(如堆积 (lag) 情况)、Broker 监控等
实现 MQ 时用到的一些底层技术
消息传输协议、序列化与反序列化、内存管理、高性能网络 IO、异步设计、数据压缩
消息存储:Zero Copy、顺序写、WAL
消息索引:索引结构、高性能索引
并发控制:高性能锁设计、CAS、减少数据共享
分布式:Broker 的高可用设计、服务发现和注册、服务协调、生产和消费负载均衡、broker 间消息同步(数据一致性)
MQ 生产实践
在生产环境中有什么好的实践来提升 MQ 的可靠性吗?在实际场景中是如何权衡消息可靠、低延迟等需要的?
说一下你们公司的 MQ 的处理消息数,比如日处理消息多少,多少台机器,怎么部署的,有没有做过一些优化配置等等(实际使用运维压测经验)
MQ 调优
如何设计一个 MQ?(要先和需求方沟通 MQ 的基本需求,要使用的场景,充分了解了业务,然后再给出一些解决方案,可能有些场景需要低延迟高可靠,有些场景需要高吞吐可容忍数据在极端情况下的丢失等)
...
接下来重点去分析引入 MQ 需要关注的这些问题,该如何解决。
MQ 通用性问题
这类问题是所有 MQ 产品都需要面对的通用问题,所以更加注重解决问题的方法、思想和权衡等。
如何选择 MQ
在需要用 MQ 时,我们面临诸多选择,第一想到的肯定是看一下目前已经存在的 MQ 产品中是否有满足当前需求而且也能为未来留有空间的产品;如果找不到,那只能借鉴已有的 MQ 产品的一些特性做自研,当然选择自研一定要慎重,需要团队有深厚的技术实力。横向对比一下常用的 MQ 产品:
特性
RocketMQ
Kafka
Pulsar
RabbitMQ
NSQ
单机吞吐量
时效(延迟) ms
可用性
Topic 数量
对吞吐的影响
消息可靠性
扩展性
功能支持
周边配套(如
SDK, 监控方案,
消息管理, Example等)
运维难度
云原生支持
社区
总结
根据如上的对比分析,可以得出一些指导性的原则,当然还是需要根据实际场景来选择。
TODO
TODO
MQ 开源产品 - RocketMQ
TODO
MQ 开源产品 - Kafka
TODO
MQ 开源产品 - NSQ
TODO
MQ 开源产品 - Pulsar
TODO
如何设计实现一个 MQ ?
单机下百万队列存储设计 (天池复赛题目)
题面描述很简单:使用 Java 或者 C++ 实现一个进程内的队列引擎,单机可支持 100 万队列以上
编写如上接口的实现。
put 方法将一条消息写入一个队列,这个接口需要是线程安全的,评测程序会并发调用该接口进行 put,每个 queue 中的内容按发送顺序存储消息(可以理解为 Java 中的 List),同时每个消息会有一个索引,索引从 0 开始,不同 queue 中的内容,相互独立,互不影响,queueName 代表队列的名称,message 代表消息的内容,评测时内容会随机产生,大部分长度在 58 字节左右,会有少量消息在 1k 左右。
get 方法从一个队列中读出一批消息,读出的消息要按照发送顺序来,这个接口需要是线程安全的,也即评测程序会并发调用该接口进行 get,返回的 Collection 会被并发读,但不涉及写,因此只需要是线程读安全就可以了,queueName 代表队列的名字,offset 代表消息的在这个队列中的起始索引,num 代表读取的消息的条数,如果消息足够,则返回 num 条,否则只返回已有的消息即可,若消息不足,则返回一个空的集合。
参考:
Reference
经典必读
日志:每个软件工程师都应该知道的有关实时数据的统一概念 - 经典必读, 英文版,另外一个中文版地址
消息队列通用问题 - 面试必备
其他
为什么使用 MQ?
MQ 有什么优缺点?
几种 MQ 产品的对比,以及适用场景
最后更新于