在當(dāng)今的時(shí)代下,固態(tài)硬盤已成為企業(yè)中的熱門技術(shù)。但斯坦福大學(xué)的計(jì)算機(jī)科學(xué)團(tuán)隊(duì)認(rèn)為有更好的解決方案。他們已經(jīng)想出了可擴(kuò)展且高性能的存儲方法,其被稱為RAMCloud。這種解決方案可存儲動態(tài)隨機(jī)存儲器中的所有數(shù)據(jù)。同時(shí)還可以聚合整個(gè)數(shù)據(jù)中心的內(nèi)存資源。
RAMCloud的可擴(kuò)展性和性能方面表現(xiàn)使它成為高性能計(jì)算的關(guān)鍵技術(shù)。特別是數(shù)據(jù)密集型的應(yīng)用程序,而此技術(shù)在計(jì)算密集型的應(yīng)用程序則表現(xiàn)一般。
相對于RAMCloud 磁盤和閃存的速度都已顯得力不從心
RAMCloud項(xiàng)目由斯坦福大學(xué)教授John Ousterhout發(fā)起。同時(shí)他也是Tcl腳本語言的發(fā)明者。他還是Electric Cloud公司的董事長,Electric Cloud公司成立于2002年,其主要業(yè)務(wù)是提供高性能軟件構(gòu)件工具。Ousterhout在高性能計(jì)算領(lǐng)域進(jìn)行了深入的研究,并對分布式文件系統(tǒng)和高性能文件系統(tǒng)有所研究。簡而言之,RAMCloud是在數(shù)據(jù)中心或集群的大量服務(wù)器中匯集在內(nèi)存中所有應(yīng)用程序數(shù)據(jù)的軟件平臺。RAMCloud可提供比基于磁盤存儲低100-1000倍延遲和比以往高100-1000倍的吞吐量。
研究人員相信目前的所依賴的硬盤技術(shù)將不足以應(yīng)對數(shù)據(jù)密集型應(yīng)用,這個(gè)趨勢正在蔓延到企業(yè)計(jì)算的各個(gè)方面。研究人員還在文章中宣布如果RAMCloud成功,它將會取代磁盤從而作為數(shù)據(jù)中心主要的存儲技術(shù)。
RAMCloud的兩個(gè)最吸引人的特性是能夠擴(kuò)展到數(shù)以千計(jì)的服務(wù)器并能夠保持極低的延遲。
RAMCloud的延遲可低至5-10微秒。這比傳統(tǒng)磁盤快1000倍,比閃存要快5倍左右。研究人員表示RAMCloud的低延遲特性對于對低延遲有苛刻要求的Web的應(yīng)用來說都有些顯得性能過剩。但還是應(yīng)該鼓勵(lì)這種技術(shù)的發(fā)展,這會帶來巨大的性能優(yōu)勢。同時(shí)對于一些高性能計(jì)算(HPC)應(yīng)用,RAMCloud的低延遲特性則顯得如魚得水。
但網(wǎng)絡(luò)延遲對RAMCloud低延遲優(yōu)勢的影響也是不可回避的問題。雖然像InfiniBand、Myrinet和Arista等高性能以太網(wǎng)廠商可實(shí)現(xiàn)跨數(shù)據(jù)中心10微秒延遲數(shù)據(jù)傳輸。但今天大多數(shù)設(shè)備采用的TCP/IP以太網(wǎng)的延遲達(dá)到了300-500微秒。網(wǎng)絡(luò)延遲方面的優(yōu)化是RAMCloud性能最大化的關(guān)鍵因素。
至于可擴(kuò)展方面,研究人員認(rèn)為使用當(dāng)下的商用服務(wù)器和存儲技術(shù)RAMCloud的規(guī)??筛哌_(dá)500TB。在未來5-10年RAMCloud的成本可能會降到每GB 5美元,并且規(guī)??蛇_(dá)到1-10PB。
圖表代表三種存儲技術(shù)在不同大小數(shù)據(jù)集和不同訪問頻率的成本(斯坦福大學(xué)計(jì)算機(jī)科學(xué)系繪制)
但在當(dāng)今的市場,RAMCloud存儲成本為每GB 60美元左右。DRAM系統(tǒng)的相對于磁盤和固態(tài)存儲來說還是略顯昂貴的。DRAM存儲系統(tǒng)比傳統(tǒng)的磁盤的價(jià)格貴50-100倍,比閃存貴5-10倍。但對于高吞吐量I/O應(yīng)用DRAM還是能夠體現(xiàn)其價(jià)值的。研究人員表示如果你的代碼執(zhí)行速度夠快,你就可以突破存儲數(shù)據(jù)訪問的約束。從這個(gè)角度看DRAM其實(shí)比比傳統(tǒng)硬盤價(jià)格低10-100倍。
這項(xiàng)技術(shù)也不可避免的面臨一些問題,包括精確的數(shù)據(jù)模型和API、如何優(yōu)化遠(yuǎn)程調(diào)用延遲、數(shù)據(jù)持久型和可用性、集群管理、多租戶的應(yīng)用、以及支持原子更新等技術(shù)還在摸索中。然而,這些都是可以解決的問題。
隨著數(shù)據(jù)中心的擴(kuò)展建設(shè),未來將會浮現(xiàn)出越來越多的數(shù)據(jù)密集型應(yīng)用。這為RAMCloud的普及奠定了基礎(chǔ)?,F(xiàn)在還沒有一個(gè)RAMCloud項(xiàng)目變成商業(yè)產(chǎn)品的時(shí)間表。不過Ousterhout在Electric Cloud的經(jīng)驗(yàn)可幫助RAMCloud盡快在商業(yè)領(lǐng)域中應(yīng)用。
{{item.content}}