超大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)無(wú)論是在架構(gòu)、技術(shù)還是運(yùn)維上都發(fā)生了巨大的變革,有效地支持了互聯(lián)網(wǎng)和云計(jì)算過(guò)去10年的繁榮。展望未來(lái),在人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云原生等技術(shù)和業(yè)務(wù)的驅(qū)動(dòng)下,數(shù)據(jù)中心網(wǎng)絡(luò)該向何處發(fā)展是專業(yè)人士們必須考慮和面對(duì)的問(wèn)題。該文結(jié)合行業(yè)發(fā)展測(cè)未來(lái)超大規(guī)模數(shù)據(jù)中心網(wǎng)絡(luò)的發(fā)展趨勢(shì)如下:
一 網(wǎng)絡(luò)帶寬持續(xù)演進(jìn),芯片是核心競(jìng)爭(zhēng)力
在人工智能、大數(shù)據(jù)、機(jī)器學(xué)習(xí),以及高清視頻、AR、VR等技術(shù)和業(yè)務(wù)的驅(qū)動(dòng)下數(shù)據(jù)中心對(duì)網(wǎng)絡(luò)的帶寬需求將繼續(xù)呈加速發(fā)展的趨勢(shì)。數(shù)據(jù)中心交換機(jī)芯片在未來(lái)5年依然會(huì)處在加速迭代之中,芯片技術(shù)的摩爾定律會(huì)依舊有效,大概每隔2年交換機(jī)芯片的容量就會(huì)增長(zhǎng)一倍。SerDe技術(shù)也在從10Gbit/s、25Gbit/s向50Gbit/s、100Gbit/s快速迭代,相應(yīng)的光模塊技術(shù)也逐漸從25Gbit/s、50Gbit/s、100Gbit/s向400Gbit/s、800Gbit/s和Tbit/s級(jí)發(fā)展。交換機(jī)芯片技術(shù)和光芯片技術(shù)的持續(xù)迭代將有力保障數(shù)據(jù)中心網(wǎng)絡(luò)對(duì)帶寬的增長(zhǎng)需求,而網(wǎng)絡(luò)帶寬的演進(jìn)必然會(huì)牽引計(jì)算存儲(chǔ)架構(gòu)的演進(jìn)。
除了容量持續(xù)演進(jìn),芯片具備可編程能力將逐漸成為主流,對(duì)網(wǎng)絡(luò)可視化支持的力度將會(huì)成為芯片的核心競(jìng)爭(zhēng)力之一。
二 硬件白盒化、OS開(kāi)源、軟件自主掌控
SDN理念帶來(lái)設(shè)備解耦生態(tài)逐漸成熟,芯片商業(yè)化、硬件白盒化和定制化、軟件自主掌控將進(jìn)一步普及。自主研發(fā)交換機(jī)設(shè)備不僅是為了節(jié)省成本,更是通過(guò)自主把控軟件、定制化硬件,做到軟硬件的一體化,這不僅可以快速迭代網(wǎng)絡(luò)功能來(lái)支持業(yè)務(wù)發(fā)展的需要,更能做到對(duì)網(wǎng)絡(luò)的靈活高效監(jiān)控,并最終把網(wǎng)絡(luò)變得更穩(wěn)定和智能,讓網(wǎng)絡(luò)真正成為核心競(jìng)爭(zhēng)力。
目前,基于開(kāi)源的開(kāi)放生態(tài)已經(jīng)逐漸成熟,交換機(jī)操作系統(tǒng)可以依賴生態(tài)的力量,而互聯(lián)網(wǎng)公司可以專注在上層的軟件和運(yùn)營(yíng)管理系統(tǒng)。自主研發(fā)交換機(jī)設(shè)備將不再僅僅局限于幾個(gè)少數(shù)超大規(guī)模的互聯(lián)網(wǎng)和云計(jì)算公司,越來(lái)越多的公司將加入這一陣營(yíng)。
在當(dāng)下的開(kāi)放生態(tài)環(huán)境下,開(kāi)源操作系統(tǒng)更加有利于芯片、硬件和軟件的標(biāo)準(zhǔn)化和兼容性,有利于生態(tài)的良性發(fā)展,開(kāi)源操作系統(tǒng)將會(huì)成為互聯(lián)網(wǎng)云計(jì)算公司的首選。值得一提的是,由微軟公司倡導(dǎo),阿里巴巴作為主力成員推動(dòng)的開(kāi)源SONiC系統(tǒng)得到了業(yè)界的廣泛關(guān)注和支持。
三 軟硬件一體化的高性能網(wǎng)絡(luò)轉(zhuǎn)發(fā):網(wǎng)卡硬件卸載和可編程芯片
眾所周知,CPU的摩爾定律已入暮年,而云服務(wù)和機(jī)器學(xué)習(xí)規(guī)模卻在呈指數(shù)級(jí)增長(zhǎng)。虛擬交換機(jī)是云數(shù)據(jù)中心網(wǎng)絡(luò)不可分割的一部分,但是基于服務(wù)器的網(wǎng)絡(luò)處理方案也并非一帆風(fēng)順,40GbE甚至100GbE網(wǎng)絡(luò)架構(gòu)的快速采用、服務(wù)器外部吞吐量大幅提升、網(wǎng)絡(luò)安全等附加功能的堆疊、大量虛擬機(jī)的增加,導(dǎo)致CPU資源被大量用于內(nèi)外部網(wǎng)絡(luò)和附加功能,使數(shù)據(jù)中心陷入了無(wú)休止的“機(jī)海戰(zhàn)術(shù)”,從而帶來(lái)了部署規(guī)模、應(yīng)用效率、CapEx等多方面的挑戰(zhàn)。如何提升基于傳統(tǒng)x86服務(wù)器的虛擬網(wǎng)絡(luò)性能將變得至關(guān)重要。面對(duì)單服務(wù)器內(nèi)部的轉(zhuǎn)發(fā)能力的性能瓶頸,業(yè)界諸多的供應(yīng)商試圖在FPGA、多核處理器及傳統(tǒng)網(wǎng)絡(luò)處理器上開(kāi)發(fā)智能網(wǎng)卡(SmartNIC)解決方案。通俗地說(shuō),智能網(wǎng)卡是把服務(wù)器的網(wǎng)絡(luò)功能,包括vSwitch、vRouter等網(wǎng)絡(luò)組件從x86卸載到智能網(wǎng)卡上,實(shí)現(xiàn)對(duì)x86服務(wù)器處理器資源的釋放,提供更高性能的網(wǎng)絡(luò)處理性能。
SDN發(fā)展的第一波浪潮打破了管理平面、控制平面和數(shù)據(jù)平面的封閉集成,突出了軟件的作用,給網(wǎng)絡(luò)行業(yè)帶來(lái)了變革。但隨著SDN應(yīng)用的進(jìn)一步普及,純軟件的限制愈發(fā)明顯,如何更簡(jiǎn)單有效地控制底層硬件和芯片層變得愈發(fā)重要。P4(Programming Protocol-Independent Packet Processors)正是在這一背景下應(yīng)運(yùn)而生的。對(duì)底層芯片開(kāi)放的可編程的能力將會(huì)掀起下一波的SDN行業(yè)發(fā)展潮流,在軟硬件一體化、網(wǎng)絡(luò)可視化方面必然會(huì)再產(chǎn)生一次變革。
四 網(wǎng)絡(luò)融合成為一體化數(shù)據(jù)中心的 I/O:低延時(shí)網(wǎng)絡(luò)
網(wǎng)絡(luò)的功能不再是僅僅提供連接,網(wǎng)絡(luò)會(huì)變成計(jì)算機(jī)I/O的延伸。超高帶寬和超低延時(shí)的網(wǎng)絡(luò)正在將本地存儲(chǔ)和網(wǎng)絡(luò)存儲(chǔ)的界限變得模糊,為計(jì)算存儲(chǔ)分離和資源池化的數(shù)據(jù)中心一體化架構(gòu)奠定基礎(chǔ)。網(wǎng)絡(luò)是數(shù)據(jù)中心一體化中的核心組件,成為下一代高性能計(jì)算和存儲(chǔ)的強(qiáng)大驅(qū)動(dòng)力。如何降低網(wǎng)絡(luò)延時(shí)會(huì)是一個(gè)長(zhǎng)期的過(guò)程,RDMA及同類技術(shù)將會(huì)逐漸成規(guī)模部署,在應(yīng)用遇到瓶頸時(shí),將會(huì)催生革命性的新技術(shù)或架構(gòu)變革。
隨著人工智能、大數(shù)據(jù)的逐漸普及,數(shù)據(jù)中心對(duì)計(jì)算力的需求越來(lái)越高,超高密度異構(gòu)計(jì)算集群將會(huì)成為基礎(chǔ)設(shè)施的核心競(jìng)爭(zhēng)力。如何把計(jì)算芯片和高效存儲(chǔ)介質(zhì)高效地互聯(lián)在一起,并能夠大規(guī)模擴(kuò)展是需要解決的問(wèn)題。數(shù)據(jù)中心網(wǎng)絡(luò)將不僅僅局限于交換機(jī)網(wǎng)絡(luò),將進(jìn)一步延伸到主機(jī)內(nèi)部,把主機(jī)內(nèi)各種計(jì)算芯片和存儲(chǔ)介質(zhì)部件高性能地互聯(lián)在一起,并和交換機(jī)網(wǎng)絡(luò)融合為一體。傳統(tǒng)的以CPU為中心的服務(wù)器架構(gòu)將會(huì)逐漸演變?yōu)橐詳?shù)據(jù)互聯(lián)1/0為中心的架構(gòu)。網(wǎng)卡將突破傳統(tǒng)IO功能,充當(dāng)硬件虛擬化載體,以及交換機(jī)網(wǎng)絡(luò)互聯(lián)和主機(jī)內(nèi)組件互聯(lián)的橋梁。基于硬件的高速網(wǎng)絡(luò)轉(zhuǎn)發(fā)、網(wǎng)絡(luò)QoS、網(wǎng)絡(luò)可視化等功能將被拓展到主機(jī)網(wǎng)卡上。
五 網(wǎng)絡(luò)可視化技術(shù),基于大數(shù)據(jù)和人工智能的智能化運(yùn)維
自動(dòng)駕駛已經(jīng)變成可能,大規(guī)模應(yīng)用只是一個(gè)時(shí)間問(wèn)題。大規(guī)模網(wǎng)絡(luò)運(yùn)維的自動(dòng)化也必然是業(yè)界的趨勢(shì),要達(dá)到自動(dòng)駕駛或自動(dòng)化運(yùn)維都需要兩個(gè)共同的條件:一是有足夠有效的數(shù)據(jù),二是要有對(duì)數(shù)據(jù)的智能分析和處理能力。有效數(shù)據(jù)的獲取必然要通過(guò)網(wǎng)絡(luò)設(shè)備來(lái)實(shí)現(xiàn),交換機(jī)芯片的可視化功能將起著至關(guān)重要的作用。
傳統(tǒng)上我們對(duì)交換機(jī)設(shè)備的監(jiān)控和數(shù)據(jù)的獲取顆粒度很粗,一般停留在設(shè)備級(jí)別的運(yùn)行狀態(tài),包括CPU、Memory、端口、各種表項(xiàng)的監(jiān)控等;對(duì)這些信息的獲取也只是SNMP、CLI等原始方式,獲取數(shù)據(jù)的效率很低。這些都無(wú)法滿足自動(dòng)化運(yùn)維的需求。新型的交換機(jī)芯片在網(wǎng)絡(luò)可視化方面已經(jīng)邁出了堅(jiān)實(shí)可喜的一步,目前在市場(chǎng)上售賣的部分交換機(jī)芯片已經(jīng)能夠提供更豐富的信息,比如支持INT(In-bandNetwork Telemetry)功能,可以獲取特定用戶流的物理路徑、延時(shí)、交換機(jī)緩存水位等信息;MoD(Mirror on Drop)功能可以截取由于交換機(jī)管道或者緩存擁塞而導(dǎo)致的丟包信息。這些豐富的網(wǎng)絡(luò)數(shù)據(jù)通過(guò)人工智能分析系統(tǒng)將會(huì)把網(wǎng)絡(luò)運(yùn)維提升到前所未有的智能化高度一一自驅(qū)式網(wǎng)絡(luò)(Self-driving Networks)。除了信息內(nèi)容,交換機(jī)獲取信息的方式和效率也有大幅度的提升,流遙測(cè)(Streaming Telemetry)功能可以通過(guò)軟件或者直接通過(guò)芯片把監(jiān)控?cái)?shù)據(jù)高效地傳到網(wǎng)絡(luò)監(jiān)控系統(tǒng)中,對(duì)于關(guān)鍵信息的監(jiān)控顆粒度可以精確到微秒級(jí)。
六 光互聯(lián)趨勢(shì)
在10GbE速率之前,服務(wù)器與交換機(jī)比較經(jīng)濟(jì)的互聯(lián)方式是RJ45雙絞線互聯(lián)隨著速率的演進(jìn),對(duì)傳輸信號(hào)衰減要求愈發(fā)嚴(yán)苛,到25GbE 時(shí)代已經(jīng)全部統(tǒng)一到光纖或銅纜互聯(lián),到了下一代50GbE 或100GbE,銅纜的應(yīng)用距離、范圍將進(jìn)一步被壓縮;再往后演進(jìn),不僅設(shè)備間互聯(lián)銅纜將難以勝任,甚至設(shè)備內(nèi)部,從芯片到端口.都不得不采用光互聯(lián)。光互聯(lián)必將越來(lái)越普遍,光互聯(lián)技術(shù)的發(fā)展已經(jīng)成為影響網(wǎng)絡(luò)速率演進(jìn)的重要因素之一。目前,數(shù)據(jù)中心內(nèi)設(shè)備間互聯(lián)模塊及線纜成本已經(jīng)遠(yuǎn)高于。設(shè)備本身,如何控制、優(yōu)化光互聯(lián)成本對(duì)往后數(shù)據(jù)中心網(wǎng)絡(luò)成本影響巨大。
七 綠色網(wǎng)絡(luò)
隨著人工智能、大數(shù)據(jù)的逐漸普及,數(shù)據(jù)中心對(duì)計(jì)算力的需求越來(lái)越高,超高密度異構(gòu)計(jì)算集群將會(huì)成為基礎(chǔ)設(shè)施的核心競(jìng)爭(zhēng)力。計(jì)算力的大幅提升必然帶來(lái)對(duì)功耗需求的大幅上升,功耗和制冷是必須要解決的問(wèn)題,是保障超大規(guī)模數(shù)據(jù)中心可持續(xù)發(fā)展的關(guān)鍵一環(huán)。
評(píng)論