日韩人妻无码潮喷视频,日韩一级精品视频在线观看,爆乳在线观看无码av,精品国产一区二区三区在线

<strong id="ga5w8"><cite id="ga5w8"></cite></strong>
  • <b id="ga5w8"></b>

    <source id="ga5w8"></source>
  • <table id="ga5w8"></table>

  • <b id="ga5w8"></b><source id="ga5w8"></source>

    數(shù)據(jù)中心網(wǎng)絡快速排障解決方案

    2021年12月28日

    當數(shù)據(jù)中心的網(wǎng)絡規(guī)模變得很大時,不得不要增加網(wǎng)絡設備,實現(xiàn)多層級聯(lián)。現(xiàn)在的數(shù)據(jù)中心往往都是樹形結構,核心放置幾臺轉發(fā)容量超大的設備,然后下掛多層設備(因為端口數(shù)量不夠,可能需要多層),數(shù)十臺甚至幾百臺的網(wǎng)絡設備級聯(lián)到一起,一旦出了故障,如何能快速找到故障設備,經(jīng)常困擾著很多網(wǎng)絡運維人員。

    數(shù)據(jù)中心的網(wǎng)絡設備都是有冗余的,只要網(wǎng)絡故障時找到故障設備,將其隔離即可恢復業(yè)務,然后再去慢慢排查故障原因,但從數(shù)百臺的設備中找到具體哪臺故障絕非易事。網(wǎng)絡故障往往先從應用側得到故障反饋,然后開始排障,這時應用人員往往描述的只是一個應用訪問故障現(xiàn)象,他不會告訴你具體哪些地址到哪些地址不通,有時甚至是錯誤的信息,這極大延誤了問題定位時長。問題定位大部分時間都是花在故障現(xiàn)象的整理過程中,怎么辦?數(shù)據(jù)中心網(wǎng)絡該如何快速排障?本文將給出答案。

    網(wǎng)絡故障如果要從應用側反饋的故障現(xiàn)象去分析,這時已經(jīng)晚了,而且容易被應用人員帶入誤區(qū),有些應用人員反饋的現(xiàn)象只是他自己看到的,現(xiàn)象很可能只是一個局部現(xiàn)象,并不能反映出整個網(wǎng)絡的故障情況。所以要靠自己,做好網(wǎng)絡監(jiān)控,通過監(jiān)控去發(fā)現(xiàn)問題,從而迅速找到故障設備,做設備隔離或者解除故障。

    早期的網(wǎng)絡監(jiān)控主要是對設備的一些日志和端口流量做監(jiān)控,更多的時候這些信息并不夠,并不能及時發(fā)現(xiàn)問題。很多網(wǎng)絡設備廠商說自己的設備日志非常完整,但實際使用時仍有一些極端情況或者軟件BUG導致故障時無日志輸出,這時就要針對流量進行定位。到了這個時候,就需要網(wǎng)絡人員去找應用人員了解故障現(xiàn)象,通過現(xiàn)場找出一些丟包或者不通的IP地址來,然后進行網(wǎng)絡流通,對這個故障流量經(jīng)過的設備都做流通,找到故障設備。既然是樹形網(wǎng)絡,每一層都有很多設備,這個流通量是相當大的,而且并不是所有的設備都能支持對所有特征的流量做統(tǒng)計,有不支持的設備就會使得統(tǒng)計不準,加大了尋找故障設備的難度,做網(wǎng)絡運維的這些年都是這樣堅持過來的。

    然,之前的網(wǎng)絡排障方式有效但效率太低,定位故障時間長,對業(yè)務影響大?,F(xiàn)在的網(wǎng)絡監(jiān)控都是針對數(shù)據(jù)流的,對網(wǎng)絡中的具體數(shù)據(jù)流進行監(jiān)控,這樣一旦數(shù)據(jù)流量有中斷,立即可以查明故障位置。在這里,要提到幾種新興的網(wǎng)絡監(jiān)控方法,也叫網(wǎng)絡可視化技術,是快速排障的有效方法。

    · 首先是INT(In-band Network Telemetry,帶內網(wǎng)絡遙測技術)技術,INT通過在數(shù)據(jù)層面收集和報告網(wǎng)絡的狀態(tài)來實現(xiàn)對網(wǎng)絡狀態(tài)的監(jiān)控。當數(shù)據(jù)報文進入網(wǎng)絡設備時,設備上設置采樣方式采樣并鏡像出該業(yè)務流報文,INT在報文基礎上封裝一個INT頭,并將需要收集的交換機信息填入到INT數(shù)據(jù)段中,報文經(jīng)過的所有網(wǎng)絡設備均這樣處理,直到一個服務器連接的網(wǎng)絡設備將INT頭剝離。報文經(jīng)過的每臺設備都將采集到的INT報文通過gRPC報文發(fā)送到遠端的監(jiān)控服務器進行解析和呈現(xiàn),INT報文中攜帶了報文轉發(fā)的延遲、設備擁塞等情況,都能呈現(xiàn)到監(jiān)控服務器上,一旦數(shù)據(jù)報文出現(xiàn)丟包或者不通情況,監(jiān)控服務器立即感知到,并幾秒就能確定問題范圍和故障設備。

    · 其次是ERSPAN(Encapsulated Remote Switch Port Analyzer,跨三層IP傳輸?shù)倪h程網(wǎng)絡流量監(jiān)控技術),ERSPAN的報文基于GRE封裝,并通過以太網(wǎng)轉發(fā)到任何IP路由可達的地方。ERSPAN是將源端口報文復制一份通過GRE(Generic Routing Encapsulation)發(fā)送到目的服務器進行解析,采集服務器的物理位置不受限制,這樣我們可以將整個網(wǎng)絡的關鍵流量轉發(fā)都通過ERSPAN發(fā)送到監(jiān)控服務器上,流量在哪部分網(wǎng)絡出現(xiàn)了丟棄,一目了然。

    · 第三是sFlow和Netstream,這兩種都是數(shù)據(jù)采樣技術,Netstream采集的比較完整,但需要有專用的硬件來完成,在網(wǎng)絡中部署sFlow和Netstream后,可以通過gRPC將監(jiān)控數(shù)據(jù)發(fā)給服務器,由監(jiān)控服務器計算和整理,并將結果圖形化顯示出現(xiàn),一旦哪部分網(wǎng)絡有問題,立即可以在監(jiān)控服務器上顯現(xiàn)。sFlow和Netstream采集的都是報文頭的主要特征,而不是報文整個內容,這個和INT、ERSPAN有較大區(qū)別,應對絕大部分網(wǎng)絡故障排查都沒有問題,除非應用報文特征比較特殊,Netstream捕捉不到,這時只能求助INT和ERSPAN。在一個網(wǎng)絡中,并不介意三種監(jiān)控方案都部署,這樣在故障時,可以從多個角度采集的數(shù)據(jù)去分析問題。還有一點很重要,盡量要將這些數(shù)據(jù)采集通過管理網(wǎng)發(fā)向監(jiān)控服務器,否則一旦數(shù)據(jù)網(wǎng)出問題,可能監(jiān)控的數(shù)據(jù)也無法正常達到監(jiān)控服務器。大部分情況下,數(shù)據(jù)網(wǎng)絡故障很少波及到管理網(wǎng),所有設備依然可以正常訪問,如果故障時,很多設備都無法通過管理網(wǎng)進行訪問,基本可以判定這臺設備就是故障點。

    有了以上這些網(wǎng)絡監(jiān)控方法,出現(xiàn)故障時發(fā)現(xiàn)就不難了,而且完全可以實現(xiàn)自動化,當發(fā)現(xiàn)故障時,由監(jiān)控服務器自動下發(fā)隔離命令,將故障設備隔離,自動恢復。這樣在應用報障過來之前,就可以找到網(wǎng)絡故障位置,及時隔離故障設備,恢復業(yè)務,這樣可以極大縮短故障分析時間,對業(yè)務影響很小,甚至業(yè)務部分根本感知不到故障。INT和ERSPAN這些網(wǎng)絡監(jiān)控的技術實際應用的效果還未知,都是近期總被提及的技術,還有待實踐的考驗。SFLOW和Netstream技術比較成熟,但真正在網(wǎng)絡排障時用到的還不多,需要加大這方面的推廣。依靠這些監(jiān)控技術,可以快速排除網(wǎng)絡故障,這對于數(shù)據(jù)中心運維來說,意義重大,極大地提升了運維效率。


    江蘇國駿-打造安全可信的網(wǎng)絡世界

    為IT提升價值


    http://borgatopiano.com.cn/

    免費咨詢熱線:400-6776-989

    61b80d4b10435.png

    關注公眾號

    獲取免費咨詢和安全服務




    江蘇國駿信息科技有限公司 蘇ICP備17037372號-2 電話:400-6776-989; 0516-83887908 郵箱:manager@jsgjxx.com