Java進階必備：優(yōu)雅的告訴面試官消息中間件該如何實現(xiàn)高可用架構？

airen89 2019-01-25

展開全文

（1）背景引入

（2）先來思考一下消息中間件的可用性問題

（3）集群化部署 + 數(shù)據多副本冗余

（4）多副本同步復制強制要求

（5）多機器承載多副本強制要求

（6）架構原理與技術無關性

（1）背景引入

這篇文章，我們來聊一下消息中間件高可用架構的一些原理。

對于一個合格的高級Java工程師而言，你肯定會碰到在系統(tǒng)里用到MQ的場景，那么這個時候你需要基于你的業(yè)務場景和需求，考慮在使用MQ的時候可能遇到的一些技術問題。

接著，你必須得針對這些技術問題設計一套完整的技術方案。

你需要從消息的訂閱模式、消息的生產到消費全鏈路不丟數(shù)據、消息中間件本身如何保證高可用，等各個角度切入，來考慮好你的系統(tǒng)和MQ對接之后的完整技術方案。

所以，本文就來聊聊消息中間件高可用的架構原理。

（2）先來思考一下消息中間件的可用性問題

咱們先拋開各種具體的技術，就來思考一下，啥是MQ的可用性問題？

大家看看下面的圖，其實道理很簡單，假如你的MQ就部署在一臺機器上，那么正常情況下，生產者都會發(fā)送消息到MQ去，然后讓消費者獲取到。

但是萬一天有不測風云，MQ部署的那臺機器，因為一些莫名的原因，MQ自己本身的進程掛掉了，或者是那臺機器直接就宕機了，那么此時怎么辦呢？

很尷尬，是不是，結果是很明顯的，生產者沒法發(fā)送數(shù)據出去，然后消費者也沒法獲取到數(shù)據了。

然后整個系統(tǒng)不就完蛋了？因為系統(tǒng)的核心流程根本無法跑通了，對不對？

MQ宕機就直接導致你的系統(tǒng)本身也故障了，然后可能會導致你的公司對外的APP、網站等產品就無法運作了，用戶無法使用你們公司的服務了。

如果你們公司是電商平臺、外賣平臺、社交平臺。那么來這么一出，不是會導致公司損失慘重？

如果你的系統(tǒng)持續(xù)幾個小時無法被人使用，本來你公司電商平臺一天營收可以達到1億，結果現(xiàn)在導致幾個小時內無法下單購買商品，最后當天營收就5000萬，那么你的公司是不是直接活生生損失了5000萬？

這個真的不是開玩笑的，如果大家留意互聯(lián)網行業(yè)的新聞的話和小道消息的話，就應該知道近幾年一些大型互聯(lián)網公司都出現(xiàn)過類似的情況，損失慘重，咱們做碼農的就得被祭天了是不是？

（3）集群化部署 + 數(shù)據多副本冗余

好，問題來了！現(xiàn)在你感覺一個MQ中間件應該如何實現(xiàn)高可用呢？

這里的方式有很多種，比如說數(shù)據多副本冗余，集群鏡像同步機制，我們就拋開具體的技術來從本質層面思考一下MQ集群實現(xiàn)高可用的幾種方式。

先來看下面的一張圖，假設我們寫到MQ的數(shù)據都被多副本冗余了，也就是你寫的每一條消息都被復制到了其他的機器上去了。

那么此時任何一臺機器宕機，似乎都不會影響我們跟MQ繼續(xù)通信，而且寫出去的數(shù)據似乎也都還在。

上面的圖里，MQ采用集群模式部署到了2臺機器上去，然后生產者給其中一臺機器寫入一條消息，該機器自動同步復制給另外一臺機器。

此時數(shù)據在2臺機器上，就有2個副本了，那么如果第一臺機器宕機了，會影響我們嗎？

答案是：不會。

因為數(shù)據本身是多副本冗余的，此時消費者完全可以從第二臺機器消費到這條消息，并且生產者還可以繼續(xù)給第二臺機器寫入消息，數(shù)據沒丟失。

而且，系統(tǒng)根本不用中斷流程，還可以繼續(xù)運行，我們看下面的圖。

這種感覺是不是很棒？實際上這種MQ集群化部署架構以及數(shù)據多副本冗余機制，是非常常見的一種高可用架構。

Kafka這個極為優(yōu)秀的消息中間件，就是采用的這種架構保證高可用、數(shù)據容錯性。

（4）多副本同步復制強制要求

但是這里你要思考另外幾個問題，第一個就是：你在寫數(shù)據到其中一臺機器的時候，是不是得要求，必須得讓那臺機器復制數(shù)據到另外一臺機器了，保證集群里一定有這條數(shù)據雙副本了，才可以認為本次寫成功了？

沒錯，假如你要是不能保證這一點，比如你就寫數(shù)據給了其中一臺機器，然后他還沒來得及復制給另外一臺機器呢，直接第一臺機器就宕機了。

此時雖然你可以繼續(xù)基于第二臺機器發(fā)送消息和消費消息，但是你剛才發(fā)送的一條消息就丟失了。

大家看下面的圖來理解一下這個場景。

所以對于采用這種機制的時候，你必須得讓生產者通過一些參數(shù)的設置，保證說寫一條消息到某臺機器，他必須同步這條消息到另外一臺機器成功，集群里有雙副本了，然后此時才可以認為這條消息寫成功了。

但凡剛寫一臺機器他就宕機，還沒來得及復制到另外一臺機器的話，本次寫應該報錯失敗，然后你應該重試再次寫入數(shù)據到MQ集群里去。

大家看看下面的圖。只要你一次寫成功了，他就保證肯定已經同步數(shù)據為雙副本了，此時哪怕一臺機器宕機，數(shù)據不會丟失，生產和消費都可以有條不紊的繼續(xù)進行。

（5）多機器承載多副本強制要求

第二個問題，假如說現(xiàn)在你的集群中本來有兩臺機器，現(xiàn)在宕機了其中的一臺，只有一臺機器了，你還能允許你的生產者對唯一的一臺機器繼續(xù)寫入數(shù)據嗎？

答案是：否。

因為如果集群里只有一臺機器可以承載寫入，那么萬一剩余的一臺機器又宕機了呢？是不是還是會導致數(shù)據丟失，集群完蛋？

所以說，你的生產者同理應該基于參數(shù)設置一下，集群里必須有超過2臺機器可以接收你的數(shù)據副本復制。

否則如果只有1臺機器可以接受你的數(shù)據副本復制的話，那么還是算了。

大家看看下面的圖，感受一下那個場景。

假設集群里有3臺機器，那么其中一臺宕機了，你后續(xù)再寫入另外一臺的時候，判斷一下集群里還有剩余兩臺機器，足以保證數(shù)據雙副本的高可用性和容錯性，所以可以繼續(xù)正常的寫入數(shù)據到MQ集群里去。

實際上，上面說的那一整套的機制，在Kafka里都可以采用，他有對應的一些參數(shù)可以配置數(shù)據有幾個副本，包括你每次寫入必須復制到幾臺機器才可以算成功，否則就要重新發(fā)送，以及你的集群剩余機器必須可以承載幾個副本才能繼續(xù)寫入數(shù)據。

通過這一整套方案的設計和基于具體技術的落地，才可以保證在集群化部署的情況下，集群必須有幾臺機器承載多副本，同時數(shù)據寫入之后必須是保證多副本冗余的。

此時，任何機器宕機，數(shù)據都不會丟失，還可以正常讓系統(tǒng)繼續(xù)運行。

（6）架構原理與技術無關性

其實本文對消息中間件的集群高可用架構的探討，是完全脫離于某個具體技術的，非常樸素的從本質的原理層面來討論這個話題。

具體的RabbitMQ、Kafka、RocketMQ等各種不同的消息中間件，對這種高可用架構的實現(xiàn)，都有一定的相似想通性，但是也都有各自不同的技術實現(xiàn)，以及相對應的區(qū)別。

后面我們再通過不同的文章，以各種MQ中間件的具體技術實現(xiàn)舉例來討論一下相關的架構是如何落地的。

End

本站是提供個人知識管理的網絡存儲空間，所有內容均由用戶發(fā)布，不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息，謹防詐騙。如發(fā)現(xiàn)有害或侵權內容，請點擊一鍵舉報。

轉藏分享

QQ空間 QQ好友新浪微博微信

獻花（0） +1

來自： airen89 > 《架構原理》

舉報/認領

0條評論

發(fā)表

請遵守用戶評論公約

類似文章 更多

airen89

關注對話

TA的最新館藏

一個選擇，便是一生
外灘講話，談是新時代金融業(yè)的旋律
應對618，京東到家訂單系統(tǒng)高可用架構的迭代實戰(zhàn)
數(shù)據倉庫、數(shù)據湖、流批一體，終于有大神講清楚了！
Redis常見延遲問題排查手冊！附33條優(yōu)化建議
《信條》，大導演諾蘭的逆行

喜歡該文的人也喜歡更多

熱門閱讀換一換

日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

Java進階必備：優(yōu)雅的告訴面試官消息中間件該如何實現(xiàn)高可用架構？

Java進階必備：優(yōu)雅的告訴面試官消息中間件該如何實現(xiàn)高可用架構？