背景:大海里,魚類可以毫不費力地做到兼具速度與優(yōu)雅于一身,最快游速達(dá)每小時 70 英里,而人類甚至難以達(dá)到每小時 4 英里,即便潛艇也只能達(dá)到每小時 50 英里。魚類為何能獲得如此快的速度,這個問題令物理學(xué)家、生物學(xué)家和工程師們著迷;如今面對“數(shù)據(jù)密集型”新范式,為了幫助企業(yè)在數(shù)據(jù)海洋里游出加速度,各家存儲廠商也紛紛放出大招。
真實海洋里,魚類的高速游動涉及到復(fù)雜的3D流體動力作用
在數(shù)據(jù)“海洋”,浪潮面對數(shù)據(jù)密集型新范式帶來的性能挑戰(zhàn)提出應(yīng)對策略
圖片來源:麻省理工科技評論
正文:
7月28日,2022全球閃存峰會線上召開,匯聚了國內(nèi)外專家學(xué)者,共同論道全球閃存與存儲半導(dǎo)體產(chǎn)業(yè)發(fā)展趨勢。浪潮信息存儲產(chǎn)品線副總經(jīng)理李博樂表示,隨著云、大數(shù)據(jù)、AI等新技術(shù)快速發(fā)展,數(shù)據(jù)成為數(shù)字經(jīng)濟時代的關(guān)鍵要素和核心引擎。浪潮存儲的使命是秉承浪潮信息智慧計算戰(zhàn)略,為企業(yè)構(gòu)建以存儲平臺為核心的業(yè)界領(lǐng)先的數(shù)據(jù)基礎(chǔ)設(shè)施,基于盤控協(xié)同充分釋放閃存力量。
浪潮信息存儲產(chǎn)品線副總經(jīng)理 李博樂
數(shù)據(jù)密集型新范式 考驗數(shù)據(jù)處理能力
模擬腦神經(jīng)網(wǎng)絡(luò),探索人腦上千億個神經(jīng)元之間是如何連接與工作的,帶來每秒百TB級數(shù)據(jù)高吞吐量;1000輛自動駕駛汽車每天產(chǎn)生數(shù)十PB的實時數(shù)據(jù),用來訓(xùn)練AI視覺識別算法;油氣勘探,一次三維勘探會產(chǎn)生PB級原始實時數(shù)據(jù),后期數(shù)據(jù)分析和處理中還會生成15倍體量的次生數(shù)據(jù)……
數(shù)字經(jīng)濟時代,在“數(shù)據(jù)密集型”的新范式驅(qū)動下,傳統(tǒng)數(shù)據(jù)中心正在向云化數(shù)據(jù)中心快速演進(jìn)。這是因為在傳統(tǒng)數(shù)據(jù)中心中,應(yīng)用與基礎(chǔ)設(shè)施緊耦合,IT架構(gòu)呈現(xiàn)孤島狀,數(shù)據(jù)不流動、不共享,如同一潭死水。而在云化數(shù)據(jù)中心中,計算資源實現(xiàn)了虛擬化,信息孤島被打通,涓涓數(shù)據(jù)河流匯聚成汪洋大海,各個行業(yè)可以基于海量數(shù)據(jù)間的相關(guān)性分析加速業(yè)務(wù)創(chuàng)新,創(chuàng)造新商業(yè)、新業(yè)態(tài)。
例如,在當(dāng)前非常熱門的類腦科學(xué)研究,有一個重要的方向就是多模態(tài)多尺度數(shù)據(jù)分析理論與應(yīng)用。首先建立腦成像中心,全套磁共振成像設(shè)備對小動物或者人體進(jìn)行腦成像,不斷采集和分析腦科學(xué)數(shù)據(jù),構(gòu)建起多模態(tài)多尺度腦數(shù)據(jù)庫;然后,再利用模式識別、深度學(xué)習(xí)等類腦智能方法尋找基因、腦影像和認(rèn)知功能的診斷指標(biāo),以揭示腦疾病致病機制、提升腦疾病臨床診斷以及藥物療效評估的準(zhǔn)確性和效率。這個例子只是冰山一角,“數(shù)據(jù)密集型”新范式已經(jīng)成為驅(qū)動各行各業(yè)創(chuàng)新型發(fā)展、高質(zhì)量增長的加速器。
然而,正如硬幣的AB面,數(shù)據(jù)密集型新范式、數(shù)據(jù)中心云化在為大數(shù)據(jù)挖掘帶來利好的同時,也使得數(shù)據(jù)基礎(chǔ)設(shè)施需要面對海量的客戶端、應(yīng)用,爆炸式增長的海量多模態(tài)數(shù)據(jù),對數(shù)據(jù)基礎(chǔ)設(shè)施的處理能力提出了更高要求。
以盤控協(xié)同為核心 釋放閃存潛能
面對海量新數(shù)據(jù)、新應(yīng)用挑戰(zhàn),浪潮存儲如何釋放閃存的性能呢?對此,李博樂表示,浪潮提出新存儲之道,堅持存儲即平臺理念,以盤控協(xié)同策略為核心,充分發(fā)揮閃存性能,打造極致性價比。
浪潮存儲
首先,存儲系統(tǒng)要想發(fā)揮出閃存的性能,需要闖過三道關(guān)。第一,隨著NAND介質(zhì)、NVMe協(xié)議、SCM等新介質(zhì)的出現(xiàn),存儲系統(tǒng)性能的瓶頸已經(jīng)不在盤上,而在于軟件棧,要想用好性能較高的閃存盤,就需要優(yōu)化存儲系統(tǒng)軟件棧,解決系統(tǒng)性能瓶頸。第二,過去的若干年CPU的發(fā)展一直遵循摩爾定律,性能飛躍式發(fā)展,但最近幾年,CPU性能的發(fā)展進(jìn)入瓶頸期,性能提升緩慢,如果想進(jìn)一步提升存儲系統(tǒng)性能,就需要借助DPU、FPGA、數(shù)據(jù)壓縮卡等額外的硬件做協(xié)處理,對系統(tǒng)進(jìn)行加速。第三,數(shù)據(jù)存儲需要優(yōu)化元數(shù)據(jù)和數(shù)據(jù)的寫入策略,減少不必要的垃圾回收,提升系統(tǒng)性能。
其次,存儲系統(tǒng)如何降低閃存的使用成本。雖然閃存的成本在趨勢上不斷下降,會替代2.5寸機械盤,但成本仍高于3.5寸大容量機械盤。另外,不同閃存介質(zhì),對應(yīng)的可擦寫次數(shù)或者說使用壽命是不同的,而且差異很大,比如當(dāng)前主流的TLC和QLC介質(zhì)可擦寫次數(shù)就相差5倍。所以根據(jù)數(shù)據(jù)熱度的不同,合理使用介質(zhì),以及提升介質(zhì)壽命和空間利用率,可以有效降低使用成本。
對于上面兩個難題,李博樂認(rèn)為,盤控協(xié)同是最優(yōu)解。
比如在提升性能方面,浪潮存儲是業(yè)界唯一具備存儲軟件棧和閃存盤全棧的技術(shù)研發(fā)能力的廠商,可以通過盤控協(xié)同,推進(jìn)閃存盤面向特定場景的定向調(diào)優(yōu),存儲系統(tǒng)性能;還能基于元數(shù)據(jù)與數(shù)據(jù)的寫入優(yōu)化,降低寫放大,讓系統(tǒng)性能再上一個臺階。在SPC-1國際基準(zhǔn)測試中,浪潮存儲六次刷新存儲性能世界記錄。
李博樂表示,今年IPF上,浪潮存儲還出新一代PCIe 4.0 NVMe 企業(yè)級SSD。我們通過拓展NAND與控制器之間的通道,大幅提升SSD性能,實現(xiàn)業(yè)界領(lǐng)先的性能水平,其中順序?qū)懶阅艹^5GB/s,隨機寫性能超過45萬IOPS,超越所有主流廠商。
又如圍繞降低閃存使用成本這個難題,浪潮存儲采用介質(zhì)分層技術(shù),將不同熱度的數(shù)據(jù)存在不同的介質(zhì)中,避免介質(zhì)性能瓶頸和介質(zhì)“大材小用”,此外,像浪潮這樣擁有介質(zhì)研發(fā)能力的廠商,通過不斷優(yōu)化數(shù)據(jù)管理算法和容錯算法,能夠提升SSD盤本體壽命,降低客戶TCO;并且通過盤控協(xié)同,通過合理的數(shù)據(jù)組織減少寫放大縮減閃存盤的OP,提升SSD的空間利用率。
李博樂表示,目前,浪潮信息聚焦智慧計算戰(zhàn)略,以算力、算法、數(shù)據(jù)、網(wǎng)絡(luò)四大支柱,為客戶構(gòu)建開放、敏捷、集約、高效的數(shù)字信息基礎(chǔ)設(shè)施。浪潮存儲近幾年表現(xiàn)非常亮眼,市場增速中國第一,存儲裝機容量已經(jīng)位居全球前三、中國前一。今后,浪潮存儲希望借助新一代G6存儲平臺、企業(yè)級SSD,以全棧技術(shù)創(chuàng)新加速存儲業(yè)務(wù)增長,釋放數(shù)據(jù)價值加速數(shù)實相融。