【“一云多芯”是云計(jì)算平臺(tái)的核心能力之一,是芯與云的融合,是平臺(tái)+生態(tài)的協(xié)同;“分層解耦”是構(gòu)建下一代云數(shù)據(jù)中心、構(gòu)建私有云生態(tài)的重要路徑” 】
近年來,我國從芯片、整機(jī)、操作系統(tǒng)、云平臺(tái)、中間件到應(yīng)用軟件等技術(shù)領(lǐng)域的創(chuàng)新鏈、產(chǎn)業(yè)鏈已初步形成,以X86、ARM、Power等不同架構(gòu)處理器的為基礎(chǔ)的產(chǎn)業(yè)生態(tài)框架已基本就緒。國內(nèi)IT產(chǎn)業(yè)生態(tài)也隨著新一代技術(shù)應(yīng)用場(chǎng)景不斷拓展,已經(jīng)形成了多技術(shù)路線全棧式支撐能力。在數(shù)據(jù)中心建設(shè)方面,隨著企業(yè)“上云用數(shù)賦智”的不斷加速和深化,新場(chǎng)景下的算力孤島問題逐漸凸顯。如何實(shí)現(xiàn)多種芯片技術(shù)路線的高效協(xié)同,以應(yīng)用為導(dǎo)向、從系統(tǒng)設(shè)計(jì)視角出發(fā),滿足多芯共存、多云異構(gòu)條件下的云原生環(huán)境構(gòu)建,保障業(yè)務(wù)應(yīng)用的穩(wěn)定運(yùn)行、平滑切換和線性增長,成為新一代云數(shù)據(jù)中心架構(gòu)體系需要攻克的新的挑戰(zhàn)。
圖:浪潮信息副總裁 張東
云計(jì)算是協(xié)同紐帶,“一云多芯”是關(guān)鍵
‘“一云多芯”是打破小生態(tài)、構(gòu)建大生態(tài)的關(guān)鍵紐帶。信息技術(shù)產(chǎn)業(yè)鏈發(fā)展迅速,相關(guān)技術(shù)及產(chǎn)品已開始大規(guī)模應(yīng)用于金融、通信、政府等關(guān)鍵行業(yè)。但從產(chǎn)業(yè)鏈協(xié)同上看,各環(huán)節(jié)垂直封閉、生態(tài)離散,多個(gè)小生態(tài)并行存在。自有封閉小生態(tài)的排他性不利于產(chǎn)業(yè)的健康發(fā)展,難以形成產(chǎn)業(yè)合力,同時(shí)又給行業(yè)用戶在技術(shù)選型上帶來困擾。如何打破小生態(tài)壁壘,避免因技術(shù)選型失誤帶來的業(yè)務(wù)轉(zhuǎn)型失敗是各個(gè)行業(yè)關(guān)心的話題。在我們看來,“一云多芯”無疑是個(gè)最佳選擇。同時(shí),其在一定程度上激發(fā)了IT產(chǎn)業(yè)鏈上下游的創(chuàng)新活力,進(jìn)而促進(jìn)整體生態(tài)的協(xié)同發(fā)展。
“一云多芯”可滿足用戶算力多樣化需求,并且可有效規(guī)避算力孤島。隨著各行各業(yè)業(yè)務(wù)創(chuàng)新的爆發(fā)式增長,不同業(yè)務(wù)場(chǎng)景對(duì)算力需求的差異化也越來越多,更多的算力供給從處理器向各種加速器(包括GPU、DPU、FPGA等)轉(zhuǎn)移。為充分發(fā)揮多元異構(gòu)(不同架構(gòu)、不同種類)芯片的能力優(yōu)勢(shì),金融、能源等關(guān)鍵行業(yè)應(yīng)基于多種芯片架構(gòu)來構(gòu)建云基礎(chǔ)設(shè)施底座,實(shí)現(xiàn)多元算力的統(tǒng)一池化管理、統(tǒng)一調(diào)度以及業(yè)務(wù)的差異化部署等,逐步實(shí)現(xiàn)從算力并存到算力統(tǒng)一。
“一云多芯”可有效降低供應(yīng)鏈風(fēng)險(xiǎn)。“一云多芯”是IT產(chǎn)業(yè)鏈承上啟下的關(guān)鍵環(huán)節(jié),具備對(duì)下納管底層各種芯片,屏蔽底層基礎(chǔ)設(shè)施異構(gòu)芯片差異,對(duì)上提供開放、統(tǒng)一的算力接口。但是,目前在云計(jì)算產(chǎn)業(yè)中,各服務(wù)器芯片的表現(xiàn)參差不一,導(dǎo)致用戶體驗(yàn)難以一致,應(yīng)用效果也大相徑庭。用好“一云多芯”,可以最大程度的降低技術(shù)路線的選擇風(fēng)險(xiǎn),極大提升業(yè)務(wù)穩(wěn)定性以及業(yè)務(wù)改造的靈活性。
由此可見,無論是從業(yè)務(wù)角度、技術(shù)角度,還是產(chǎn)業(yè)鏈角度,踐行“一云多芯“已經(jīng)成為當(dāng)下及未來云計(jì)算產(chǎn)業(yè)發(fā)展的關(guān)鍵,是產(chǎn)業(yè)鏈相關(guān)廠商的必然選擇。
“一云多芯”勢(shì)在必行,但落地挑戰(zhàn)猶存
“一云多芯”在云計(jì)算步新中已經(jīng)成為業(yè)內(nèi)共識(shí)。雖然“一云多芯”目標(biāo)明確,但在產(chǎn)業(yè)落地過程中仍存在多方面挑戰(zhàn)。
首先是理念的轉(zhuǎn)變。IT基礎(chǔ)架構(gòu)經(jīng)過長期的發(fā)展,從大機(jī)、小機(jī)時(shí)代逐步演進(jìn)到云計(jì)算時(shí)代,開放計(jì)算深入人心。但直至今日,芯片指令集、操作系統(tǒng)架構(gòu)上的差異化依然制約著架構(gòu)的橫向協(xié)同,比如一個(gè)應(yīng)用需要同時(shí)適配多個(gè)指令集和操作系統(tǒng)的問題仍然很嚴(yán)重。IT產(chǎn)業(yè)需要新的理念、新的路徑、新的設(shè)計(jì),即以CPU為核心的設(shè)計(jì)模式轉(zhuǎn)變?yōu)橐韵到y(tǒng)為核心的設(shè)計(jì),以“以應(yīng)用為導(dǎo)向,以系統(tǒng)為核心”構(gòu)建新一代產(chǎn)業(yè)生態(tài)。“一云多芯”是就是這種理念的具體體現(xiàn)。
其次是缺乏統(tǒng)一的“一云多芯”建設(shè)標(biāo)準(zhǔn)、規(guī)范。算力標(biāo)準(zhǔn)化是產(chǎn)業(yè)的愿景,因此基于”一云多芯”打造的算力平臺(tái)需要標(biāo)準(zhǔn)化、統(tǒng)一化、服務(wù)化。各廠商因技術(shù)能力差別導(dǎo)致理解和落地模式均有所不同,比如部分廠商將納管多個(gè)獨(dú)立的不同芯片架構(gòu)資源池的這種模式也包裝成“一云多芯”,由于無法實(shí)現(xiàn)真正的互聯(lián)互通,對(duì)業(yè)務(wù)的連續(xù)性造成很大的風(fēng)險(xiǎn)。
實(shí)現(xiàn)一云多芯,場(chǎng)景驅(qū)動(dòng)的軟件定義是正道
一云多芯的最終目標(biāo)是支撐用戶業(yè)務(wù)在不同架構(gòu)處理器之間的低成本切換或者自由切換。因此,基于以系統(tǒng)設(shè)計(jì)為核心的思維,采用以場(chǎng)景驅(qū)動(dòng)的“硬件重構(gòu)+軟件定義”的融合架構(gòu),是數(shù)據(jù)中心體系結(jié)構(gòu)的發(fā)展方向。我們認(rèn)為可以分“有-好-優(yōu)”三步走來實(shí)現(xiàn)一云多芯的中長期目標(biāo)。
圖:“一云多芯”三步走技術(shù)路線
第一階段,混合部署、統(tǒng)一管理、統(tǒng)一視圖
第一階段解決“有”的問題。以云為入口,通過云操作系統(tǒng)實(shí)現(xiàn)異構(gòu)處理器服務(wù)器的統(tǒng)一管理,覆蓋國內(nèi)外主流處理器,提供統(tǒng)一操作界面、操作方式及統(tǒng)一監(jiān)控運(yùn)維等,解決云資源池只能承載單一廠商或單一架構(gòu)處理器的服務(wù)器而導(dǎo)致的應(yīng)用無法跨架構(gòu)部署、協(xié)同的問題。
第二階段,業(yè)務(wù)牽引、分層解耦、架構(gòu)升級(jí)
第二階段解決“好”的問題。在第一階段的基礎(chǔ)上,進(jìn)一步實(shí)現(xiàn)應(yīng)用的低成本跨架構(gòu)切換。通過資源層、平臺(tái)層和應(yīng)用層的“分層解耦”設(shè)計(jì),實(shí)現(xiàn)架構(gòu)升級(jí)。
在資源層面,通過跨平臺(tái)的遷移實(shí)現(xiàn)應(yīng)用跨架構(gòu)快速部署。
在平臺(tái)層面,實(shí)現(xiàn)平臺(tái)應(yīng)用的跨架構(gòu)混合部署,如數(shù)據(jù)庫集群在一云多芯平臺(tái)上實(shí)現(xiàn)跨架構(gòu)的狀態(tài)同步、數(shù)據(jù)同步,實(shí)現(xiàn)了多實(shí)例在不同處理器架構(gòu)的服務(wù)器上的并行運(yùn)行。
在應(yīng)用層面,可通過服務(wù)網(wǎng)格等技術(shù)實(shí)現(xiàn)應(yīng)用的跨架構(gòu)流量切分。
第三階段,算力標(biāo)準(zhǔn)、全棧多芯、生態(tài)共建
這個(gè)階段是解決“優(yōu)”的問題。從業(yè)務(wù)連續(xù)性的維度,我們認(rèn)為”一云多芯”的終極目標(biāo)是實(shí)現(xiàn)應(yīng)用與芯片架構(gòu)的徹底解耦。這需要硬件、云以及應(yīng)用等產(chǎn)業(yè)鏈上下游的共同協(xié)同,完善異構(gòu)架構(gòu)下有效算力的量化方法,以支持應(yīng)用在不同架構(gòu)處理器間的等價(jià)切換。共同推動(dòng)應(yīng)用與云基礎(chǔ)設(shè)施的一云多芯相結(jié)合,打造垂直一體化方案,實(shí)現(xiàn)應(yīng)用層面的跨架構(gòu)無感知切換。在標(biāo)準(zhǔn)和測(cè)評(píng)方面,聯(lián)合專業(yè)軟件測(cè)評(píng)機(jī)構(gòu)及產(chǎn)業(yè)鏈上下游生態(tài),形成一云多芯行業(yè)標(biāo)準(zhǔn)。
寫在最后:
“一云多芯”已經(jīng)不再是一個(gè)簡單的口號(hào),而是構(gòu)建我國IT產(chǎn)業(yè)新生態(tài)的關(guān)鍵路徑。浪潮信息參編的基礎(chǔ)設(shè)施云管理軟件、虛擬化云平臺(tái)和容器平臺(tái)等多個(gè)國家級(jí)、行業(yè)級(jí)標(biāo)準(zhǔn),也是以分層解耦、生態(tài)共建的理念推進(jìn)我國信息產(chǎn)業(yè)健康有序發(fā)展。同樣,中國人民銀行印發(fā)的金融科技發(fā)展規(guī)劃中,也對(duì)金融行業(yè)“一云多芯”的發(fā)展以及相關(guān)金融云平臺(tái)應(yīng)用標(biāo)準(zhǔn)提出了明確的目標(biāo)及要求。浪潮信息配合某國有大型銀行進(jìn)行了“一云多芯”的實(shí)踐,采用多種芯片服務(wù)器和云海OS,完成了核心MPP數(shù)倉產(chǎn)品的認(rèn)證測(cè)試并實(shí)現(xiàn)大規(guī)模生產(chǎn)系統(tǒng)應(yīng)用。同時(shí),針對(duì)大數(shù)據(jù)、消息中心、緩存系統(tǒng)等核心業(yè)務(wù)平臺(tái)也全面開展了合作。浪潮信息參與建設(shè)的多個(gè)行業(yè)云平臺(tái),在支持一云多芯的基礎(chǔ)上,遠(yuǎn)程跨域管理、集群規(guī)模及線性擴(kuò)展能力同樣達(dá)到業(yè)界領(lǐng)先水平,單資源池規(guī)模超過1000節(jié)點(diǎn)并可按控制器實(shí)現(xiàn)線性擴(kuò)展,支撐了金融、能源、交通等行業(yè)云數(shù)智多樣化業(yè)務(wù)需求。
由此可見,遵從“以應(yīng)用為導(dǎo)向、以系統(tǒng)為核心”的設(shè)計(jì)理念,秉承“分層解耦、開放標(biāo)準(zhǔn)”的“一云多芯”建設(shè)原則,在云計(jì)算步新的發(fā)展中顯得愈發(fā)重要,這必將加速IT產(chǎn)業(yè)生態(tài)的繁榮。