企業(yè)IT的價(jià)值要讓它的客戶也就是業(yè)務(wù)部門認(rèn)同不是一件容易的事情。業(yè)務(wù)部門對企業(yè)IT往往有一些自己的看法,比如:IT提供有限的價(jià)值,是企業(yè)的成本中心;相對于IT服務(wù)的價(jià)值,IT的投資成本較高;無論是計(jì)算還是存儲(chǔ),經(jīng)常遇到容量不足的問題;不能及時(shí)響應(yīng)業(yè)務(wù)的變化;不能持續(xù)提供一致的服務(wù)水平,尤其是在可用性和彈性方面;在運(yùn)行復(fù)雜IT環(huán)境時(shí)缺乏足夠的能力;服務(wù)設(shè)計(jì)單調(diào)一致,缺乏個(gè)性化能力等。
這些認(rèn)知中的大部分可以歸結(jié)為成本、靈活性或服務(wù)水平的問題。當(dāng)企業(yè)把內(nèi)部傳統(tǒng)IT的運(yùn)行方式和效率與通過云計(jì)算服務(wù)提供的方式進(jìn)行比較時(shí),這些問題顯得更為突出。于是,如何讓企業(yè)IT以最少費(fèi)用并增加服務(wù)靈活性和一致性就成為焦點(diǎn)。
公有云服務(wù)中的一些特點(diǎn)對企業(yè)的確非常具有吸引力,比如只需要根據(jù)資源使用量付費(fèi),通過快速部署來獲得靈活性,彈性的容量擴(kuò)展,以及一致的服務(wù)水平等。但是在許多企業(yè)場景中將應(yīng)用和數(shù)據(jù)的控制權(quán)完全給第三方服務(wù)供應(yīng)商是不現(xiàn)實(shí)的,比如銀行、政府等機(jī)構(gòu)的應(yīng)用就有數(shù)據(jù)安全等方面的因素。這就帶來了私有云的概念,企業(yè)需要按照類似公有云的一些技術(shù)和服務(wù)方式來提供企業(yè)內(nèi)部IT服務(wù),也就是說企業(yè)需要自己構(gòu)建和運(yùn)維數(shù)據(jù)中心。當(dāng)然,企業(yè)自己的這些IT服務(wù)并不影響自身在適當(dāng)?shù)膽?yīng)用場景采用第三方的云計(jì)算服務(wù)。企業(yè)可以自己運(yùn)維關(guān)鍵業(yè)務(wù)系統(tǒng),但是同時(shí)也可以把一些標(biāo)準(zhǔn)的IT服務(wù)(比如電子郵件)采用第三方的云服務(wù),比如微軟的Exchange Online服務(wù)。
剖析傳統(tǒng)數(shù)據(jù)中心
當(dāng)前大部分?jǐn)?shù)據(jù)中心的IT系統(tǒng)都是采用傳統(tǒng)方式構(gòu)建的。企業(yè)在構(gòu)建這些數(shù)據(jù)中心的時(shí)候一般都把主要精力放在了保障應(yīng)用能夠穩(wěn)定、安全和可靠地運(yùn)行上,而在資源利用率、綠色環(huán)保等方面的要求相對考慮比較少。這類數(shù)據(jù)中心普遍存在以下情況。
1. 資源利用率低
數(shù)據(jù)中心中各種資源利用率低是目前普遍存在的一個(gè)問題。多家第三方機(jī)構(gòu)的調(diào)研表明企業(yè)數(shù)據(jù)中心的服務(wù)器平均利用率一般低于15%。造成服務(wù)器資源利用率低的主要原因是,各個(gè)業(yè)務(wù)部門在提出業(yè)務(wù)應(yīng)用需求時(shí)都在單獨(dú)規(guī)劃、設(shè)計(jì)其業(yè)務(wù)應(yīng)用的運(yùn)行環(huán)境,并且是按照最大業(yè)務(wù)規(guī)模的要求進(jìn)行系統(tǒng)容量的規(guī)劃和設(shè)計(jì)。比如,一個(gè)企業(yè)的財(cái)務(wù)應(yīng)用一般在月末或季末的時(shí)候使用量比較大,而其他時(shí)間的使用量則比較小,但是為了保證系統(tǒng)能夠一直穩(wěn)定運(yùn)行,這個(gè)財(cái)務(wù)應(yīng)用的資源配置方式就是按照其最高峰使用量來設(shè)計(jì)。
2. 資源孤島
根據(jù)業(yè)務(wù)系統(tǒng)的各自要求建設(shè)響應(yīng)的IT設(shè)施并進(jìn)行相應(yīng)的部署實(shí)施。各應(yīng)用系統(tǒng)建設(shè)相對獨(dú)立的孤島,因此很難從IT基礎(chǔ)架構(gòu)整體的角度來考慮資源分配及使用的合理性。在以前進(jìn)行SOA建設(shè)的時(shí)候,我們通過企業(yè)服務(wù)總線(ESB,Enterprise Service Bus)的方式,在應(yīng)用層面來避免各個(gè)應(yīng)用系統(tǒng)成為一個(gè)個(gè)獨(dú)立的煙囪。但是從基礎(chǔ)設(shè)施的角度看這些應(yīng)用系統(tǒng),它們還是一個(gè)個(gè)獨(dú)立的煙囪。
這些資源一旦分配給某個(gè)應(yīng)用系統(tǒng),就相對固化了。不論業(yè)務(wù)系統(tǒng)真正投入生產(chǎn)后的具體使用情況如何,資源都很難再進(jìn)行調(diào)配。因此,從整體上看資源利用率也普遍很低。
3. 自動(dòng)化程度很低
傳統(tǒng)數(shù)據(jù)中心資源配置和部署過程多采用人工方式,沒有相應(yīng)的平臺(tái)支持,沒有自服務(wù)和自動(dòng)部署的能力,使大量人力資源耗費(fèi)在了繁重的重復(fù)性工作上。因此,對業(yè)務(wù)部門的需求往往無法做到即時(shí)相應(yīng)和準(zhǔn)確有效。數(shù)據(jù)中心的自動(dòng)化發(fā)展就像20世紀(jì)初福特T型車開創(chuàng)高效的汽車自動(dòng)化生產(chǎn)線一樣無可避免。傳統(tǒng)數(shù)據(jù)中心對虛擬化技術(shù)的采用比較少,因此計(jì)算資源與底層物理設(shè)備的綁定使得資源的動(dòng)態(tài)分配非常困難。由于企業(yè)中的不同應(yīng)用系統(tǒng)是在不同時(shí)期由不同的項(xiàng)目團(tuán)隊(duì)建設(shè)的,因此相互之間的技術(shù)架構(gòu)和平臺(tái)差別比較大。數(shù)據(jù)中心里服務(wù)器和各種設(shè)備的數(shù)量和類型較多,不利于IT部門進(jìn)行統(tǒng)一管理與維護(hù)。由于自動(dòng)化程度較低,傳統(tǒng)企業(yè)數(shù)據(jù)中心中管理人員與服務(wù)器數(shù)量的比例一般是一比幾十,而現(xiàn)今的數(shù)據(jù)中心這個(gè)比例可以達(dá)到一比幾千。
根據(jù)麥肯錫公司的估計(jì),全球數(shù)據(jù)中心在基礎(chǔ)設(shè)施和服務(wù)方面的開支每年超過3500億美元,其中一半是在產(chǎn)品上的資本開支,一般是在人工和服務(wù)上的運(yùn)營開銷。目前IT的所有成本中大約有70%或更多是用于維護(hù)現(xiàn)有的基礎(chǔ)設(shè)施的,只有30%或更少用在新技術(shù)和新應(yīng)用的開發(fā)上。因此,數(shù)據(jù)中心的改造對企業(yè)來說意義重大。[page]
數(shù)據(jù)中心架構(gòu)正在發(fā)生的變化
話說天下大勢,合久必分,分久必合。我們可以看到一個(gè)很有意思的事情是數(shù)據(jù)中心架構(gòu)的演變也有著類似的發(fā)展規(guī)律,如圖4.2所示。在計(jì)算機(jī)剛出現(xiàn)不久的年代,數(shù)據(jù)中心最開始采用的是以主機(jī)為核心的計(jì)算方式。這是一張完全集中的方式。由于計(jì)算機(jī)的能力和計(jì)算需求都相對有限,能夠擁有計(jì)算機(jī)的企業(yè)只需要部署一套主機(jī)系統(tǒng)就可以滿足所有業(yè)務(wù)需要。主機(jī)的主要特點(diǎn)就是資源集中在一臺(tái)大型計(jì)算機(jī)系統(tǒng)中,通過硬件的冗余設(shè)計(jì)提高整個(gè)計(jì)算機(jī)的可靠性。主機(jī)操作系統(tǒng)上的不同應(yīng)用通過分時(shí)的方式共享這些計(jì)算資源。
隨著計(jì)算需求的增加,一臺(tái)主機(jī)逐漸不能滿足用戶的需求了。雖然主機(jī)本身的計(jì)算能力和可靠性都比較高,但是價(jià)格也非常高。因此,越來越多的企業(yè)開始采用一些市場上相對便宜的機(jī)遇UNIX的小型服務(wù)器。當(dāng)X86服務(wù)器出現(xiàn)之后,企業(yè)也更多地采用了這種標(biāo)準(zhǔn)的服務(wù)器。這個(gè)時(shí)期的企業(yè)數(shù)據(jù)中心的不同應(yīng)用都運(yùn)行在自己專有的硬件服務(wù)器上面,相互之間是完全獨(dú)立的。這些硬件和之上運(yùn)行的軟件一般都來自于不同的第三方供應(yīng)商。數(shù)據(jù)中心就這樣從集中演變到了相對分散的階段。
隨著計(jì)算需求持續(xù)增加,數(shù)據(jù)中心的規(guī)模也在不斷增長。一個(gè)數(shù)據(jù)中心中包含成千上萬臺(tái)服務(wù)器的情景變得更為常見。當(dāng)服務(wù)器數(shù)量持續(xù)增加的時(shí)候,我們發(fā)現(xiàn)數(shù)據(jù)中心的復(fù)雜度和管理成本急劇上升。大型數(shù)據(jù)中心面臨的另外一個(gè)問題是可靠性。當(dāng)一臺(tái)服務(wù)器的可靠性達(dá)到99.99%,這意味著一年的故障時(shí)間約為53分鐘。但是,假設(shè)數(shù)據(jù)中心中有一萬臺(tái)這樣的服務(wù)器,那么要維護(hù)高可靠性就會(huì)變得非常有挑戰(zhàn)性。雖然可以通過硬件的冗余設(shè)計(jì)來提高單臺(tái)服務(wù)器的可靠性,但是這種方式的成本比較高,而且隨著服務(wù)器數(shù)量的增加其有效性會(huì)隨之降低。因此,大型數(shù)據(jù)中心采取的是通過軟件的方式來提高系統(tǒng)的可靠性,在硬件服務(wù)器上通過一個(gè)軟件層來構(gòu)成一臺(tái)邏輯上的計(jì)算機(jī)。這樣當(dāng)?shù)讓幽骋慌_(tái)服務(wù)器出現(xiàn)故障時(shí)就可以通過軟件的方式進(jìn)行隔離,由于整個(gè)數(shù)據(jù)中心規(guī)模很大,因此對整體計(jì)算能力和可靠性不會(huì)造成影響。像微軟、Google、Yahoo等公司的數(shù)據(jù)中心,一般都是通過這種方式構(gòu)建。由于底層都采用廉價(jià)和標(biāo)準(zhǔn)的通用硬件,因此不同公司的數(shù)據(jù)中心的關(guān)鍵競爭力都在于其上運(yùn)行的軟件系統(tǒng)。
我們可以看到數(shù)據(jù)中心的計(jì)算方式從之前的分散方式又逐漸回歸到了集中方式。雖然這種集中方式是邏輯上的,但是用戶感覺到的卻是一臺(tái)巨型計(jì)算機(jī)。隨著網(wǎng)絡(luò)帶寬和軟件技術(shù)的提升,在物理上分散在不同數(shù)據(jù)中心的計(jì)算機(jī)也可以形成一個(gè)統(tǒng)一的計(jì)算平臺(tái)。
筆者在跟企業(yè)的IT管理人員交流的時(shí)候,經(jīng)常跟他們討論一個(gè)問題,那就是在做IT系統(tǒng)管理的時(shí)候是喜歡集中呢還是分散。絕大多數(shù)人的回答喜歡集中的系統(tǒng),這樣從管理上更為方便,可以采用更自動(dòng)化的管理和資源分配方式。我們現(xiàn)在可以看到的趨勢是把數(shù)據(jù)中心當(dāng)成是一臺(tái)巨型計(jì)算機(jī)。也許,這就是新的主機(jī)系統(tǒng),只不過它更強(qiáng)大、更穩(wěn)定。
動(dòng)態(tài)數(shù)據(jù)中心的基礎(chǔ)思想
企業(yè)IT需要更加有效地利用基礎(chǔ)設(shè)施資源,這不但需要高效地利用已有硬件環(huán)境,而且需要有一個(gè)可預(yù)測模型來增加新的設(shè)施。IT需要一個(gè)實(shí)時(shí)監(jiān)控機(jī)制來理解系統(tǒng)的健康狀況,并有一個(gè)自動(dòng)修復(fù)手段在出錯(cuò)情況下保證系統(tǒng)的健壯性。動(dòng)態(tài)數(shù)據(jù)中心可以幫助企業(yè)滿足這些目標(biāo)。動(dòng)態(tài)數(shù)據(jù)中心通過利用自動(dòng)化、控制和資源管理軟件,以及虛擬化技術(shù)把服務(wù)器、存儲(chǔ)和網(wǎng)絡(luò)等硬件設(shè)施整合成一個(gè)能夠共享資源,而且資源能夠動(dòng)態(tài)調(diào)節(jié)、高自動(dòng)化和高可用的新一代數(shù)據(jù)中心。
動(dòng)態(tài)數(shù)據(jù)中心符合數(shù)據(jù)中心發(fā)展的趨勢,它提高了服務(wù)的可測量水平、可信賴水平和性能,同時(shí)提高了靈活性以及硬件、軟件和IT員工的效用。從企業(yè)IT的發(fā)展來看,IT變得更為透明、面向服務(wù)并且追求效率和成本的平衡。因此,企業(yè)需要構(gòu)建一個(gè)可以很好地調(diào)節(jié)和動(dòng)態(tài)分配資源以滿足業(yè)務(wù)需求,并以合理成本實(shí)現(xiàn)業(yè)務(wù)目標(biāo)的動(dòng)態(tài)數(shù)據(jù)中心,而且它必須能夠?qū)崿F(xiàn)工作負(fù)載移動(dòng)性、自動(dòng)管理以及高可用性。
動(dòng)態(tài)數(shù)據(jù)中心帶來的變革是它為開發(fā)、構(gòu)建、部署和管理應(yīng)用和IT基礎(chǔ)設(shè)施提供了新的方式。動(dòng)態(tài)數(shù)據(jù)中心帶來的好處是多方面的。它能按照需要進(jìn)行擴(kuò)展,對市場的需求變化更為敏感。它還能讓企業(yè)IT的服務(wù)更貼近業(yè)務(wù)的需求。動(dòng)態(tài)數(shù)據(jù)中心的設(shè)計(jì)指導(dǎo)思想包括以下方面。
1. 以服務(wù)為核心
傳統(tǒng)上企業(yè)IT部門都是按照技術(shù)來進(jìn)行組織架構(gòu)設(shè)計(jì)和分工。雖然這是一個(gè)非常直觀的工作分配方式,但是這種方式增加了業(yè)務(wù)部門應(yīng)用IT的復(fù)雜度。比如,如果某個(gè)部門需要通過公司的網(wǎng)站來發(fā)布一個(gè)新產(chǎn)品,那么久需要協(xié)調(diào)各個(gè)控制不同IT基礎(chǔ)資源的團(tuán)隊(duì),包括網(wǎng)絡(luò)、應(yīng)用、網(wǎng)站和存儲(chǔ)等。業(yè)務(wù)部門需要與各個(gè)不同的團(tuán)隊(duì)協(xié)作才能保證產(chǎn)品的成功發(fā)布。企業(yè)IT需要使用ITIL模型,把部門轉(zhuǎn)型為一個(gè)面向服務(wù)的組織。這樣可以屏蔽底層IT技術(shù)的復(fù)雜性,將IT以服務(wù)的形式展現(xiàn)給最終用戶。這種方式不僅可以提高效率,還可以增加業(yè)務(wù)部門用戶的滿意度。企業(yè)IT按照服務(wù)類別來組織,然后對IT基礎(chǔ)架構(gòu)進(jìn)行統(tǒng)一管理。
通過這種面向服務(wù)的方式,企業(yè)IT可以通過內(nèi)部費(fèi)用核算的方式來對IT基礎(chǔ)設(shè)施服務(wù)進(jìn)行收費(fèi)。這種費(fèi)用核算方式可以幫助業(yè)務(wù)部門理解產(chǎn)品服務(wù)價(jià)值鏈中IT的成本,從而更有效、仔細(xì)地使用企業(yè)IT服務(wù),而不是把IT作為無限的資源利用。同時(shí)這也會(huì)促使業(yè)務(wù)部門對IT服務(wù)提出更為具體的服務(wù)水平要求,使得企業(yè)IT也要構(gòu)建最合適的架構(gòu)來滿足業(yè)務(wù)部門的需求。當(dāng)IT作為一種服務(wù)參與企業(yè)生產(chǎn)價(jià)值鏈中的時(shí)候,它也就將順理成章地逐漸演變?yōu)槠髽I(yè)的戰(zhàn)略業(yè)務(wù)資產(chǎn)之一,而不再被看成是一個(gè)成本中心。動(dòng)態(tài)數(shù)據(jù)中心作為一個(gè)用來托管服務(wù)的平臺(tái)需要采用服務(wù)管理的原則。這樣業(yè)務(wù)部門可以直接通過服務(wù)目錄來請求某種服務(wù),而不用擔(dān)心底層的網(wǎng)絡(luò)、存儲(chǔ)和服務(wù)器等基礎(chǔ)設(shè)施細(xì)節(jié)問題。所有這些具體問題都由平臺(tái)來負(fù)責(zé),對業(yè)務(wù)部門的用戶而言這些都是透明的。
2. 提供靈活性
負(fù)載的可移動(dòng)性是動(dòng)態(tài)數(shù)據(jù)中心的一個(gè)重要特征,也是其他一些要求的技術(shù)基礎(chǔ)。當(dāng)基礎(chǔ)設(shè)施可以讓負(fù)載移動(dòng)的時(shí)候,無論是通過IT管理員或自動(dòng)化軟件來移動(dòng)負(fù)載,都可以達(dá)到資源整合、節(jié)能或高可用等IT目標(biāo)。當(dāng)負(fù)載與物理資源綁定的時(shí)候,應(yīng)用程序也就是業(yè)務(wù)與物理平臺(tái)的性能、可用性和可擴(kuò)展能力等完全綁定了。這種物理環(huán)境下的負(fù)載移動(dòng)非常復(fù)雜且代價(jià)不菲。在不靈活的IT環(huán)境中遷移負(fù)載需要雙倍的資源和仔細(xì)地計(jì)劃,會(huì)花費(fèi)管理員大量的精力。動(dòng)態(tài)數(shù)據(jù)中心能夠讓用戶快速部署新服務(wù),并且能夠根據(jù)需求增加或減少資源的使用量。由于通過虛擬化等方式把資源從物理設(shè)備抽象出來了,因此就可以通過共享的方式來優(yōu)化資源的使用,從而提升基礎(chǔ)設(shè)施的利用率。這種方式不僅可降低成本,同時(shí)也可提高服務(wù)的靈活性。
3. 公共設(shè)施化
動(dòng)態(tài)數(shù)據(jù)中心能夠提供高可靠性的服務(wù),就像日常生活中的自來水、電話、電力等公共設(shè)施服務(wù)一樣。當(dāng)越來越多的應(yīng)用部署在數(shù)據(jù)中心基礎(chǔ)設(shè)施之上的時(shí)候,數(shù)據(jù)中心的可靠性就變得非常關(guān)鍵。動(dòng)態(tài)數(shù)據(jù)中心在構(gòu)建的時(shí)候強(qiáng)調(diào)系統(tǒng)的容錯(cuò)能力,但是在方案設(shè)計(jì)的時(shí)候則假定硬件肯定會(huì)出錯(cuò),因此一方面要從軟件設(shè)計(jì)角度保證平臺(tái)的可用性,另一方面要能夠盡量減少業(yè)務(wù)恢復(fù)平均時(shí)間(MTRS, Mean Time to Restore Service)。
所有動(dòng)態(tài)數(shù)據(jù)中心的基礎(chǔ)設(shè)施資源,包括網(wǎng)絡(luò)、存儲(chǔ)和服務(wù)器等,都設(shè)計(jì)成為一個(gè)統(tǒng)一的平臺(tái)。假設(shè)一個(gè)數(shù)據(jù)中心中存儲(chǔ)網(wǎng)絡(luò)SAN沒有設(shè)計(jì)成一個(gè)統(tǒng)一的平臺(tái),那么一個(gè)需要SAN的虛擬服務(wù)器A就不能快速地遷移到另外一個(gè)虛擬服務(wù)器B 。相反,由于動(dòng)態(tài)數(shù)據(jù)中心的每臺(tái)服務(wù)器連接在一個(gè)統(tǒng)一的網(wǎng)絡(luò)和存儲(chǔ)平臺(tái)上,不同的負(fù)載可以方便地進(jìn)行遷移,從而可保障服務(wù)的連續(xù)性。在一個(gè)動(dòng)態(tài)數(shù)據(jù)中心,業(yè)務(wù)部門可以不同了解底層的基礎(chǔ)設(shè)施組成,就可以得到可靠的、標(biāo)準(zhǔn)的并且可預(yù)測的服務(wù)。
4. 最小化人工操作
一個(gè)設(shè)計(jì)良好的動(dòng)態(tài)數(shù)據(jù)中心具有動(dòng)態(tài)執(zhí)行任務(wù)的能力,能夠自動(dòng)偵測異常并及時(shí)響應(yīng)。另外,數(shù)據(jù)中心上的應(yīng)用應(yīng)該能夠自動(dòng)根據(jù)負(fù)載增加或減少資源的使用。假設(shè)一個(gè)電子商務(wù)網(wǎng)站的性能由于過量的客戶訪問某熱門產(chǎn)品而下降,動(dòng)態(tài)數(shù)據(jù)中心就應(yīng)該能夠自動(dòng)偵測到Web服務(wù)器性能下降的水平,然后找出一臺(tái)有空閑處理能力的服務(wù)器,安裝一個(gè)帶新Web服務(wù)器的虛擬機(jī),生成需要的存儲(chǔ)空間并重新調(diào)整負(fù)載均衡設(shè)置。自動(dòng)化的操作是動(dòng)態(tài)數(shù)據(jù)中心的一個(gè)重要特點(diǎn),只有這樣才能大大提高服務(wù)效率。
動(dòng)態(tài)數(shù)據(jù)中心的一個(gè)核心原則是在IT服務(wù)的生命周期中盡可能少地要求人工操作。一個(gè)設(shè)計(jì)良好的動(dòng)態(tài)數(shù)據(jù)中心可以動(dòng)態(tài)地執(zhí)行運(yùn)營任務(wù),自動(dòng)偵測和響應(yīng)故障情況,并根據(jù)負(fù)載自動(dòng)增加或減少資源分配。數(shù)據(jù)中心的管理工作將按照從人工到機(jī)械(半自動(dòng))再到全自動(dòng)化的方向演進(jìn)。
5. 透明的費(fèi)用明細(xì)
動(dòng)態(tài)數(shù)據(jù)中心提供根據(jù)服務(wù)的實(shí)際消費(fèi)量計(jì)算的計(jì)費(fèi)模型。對于業(yè)務(wù)部門來說,這可以讓他們有一個(gè)非常清晰的并且可以預(yù)計(jì)的服務(wù)成本模型。這樣,業(yè)務(wù)部門和IT部門可以相對容易權(quán)衡各種方案,比如可以方便地比較一些應(yīng)用是利用第三方的服務(wù)還是使用內(nèi)部數(shù)據(jù)中心。
所以,我們可以看到數(shù)據(jù)中心的平臺(tái)設(shè)計(jì)需要從原來的硬件導(dǎo)向轉(zhuǎn)變?yōu)榉?wù)導(dǎo)向,這意味著要構(gòu)建能夠自適應(yīng)和調(diào)整的動(dòng)態(tài)數(shù)據(jù)中心。如果從數(shù)據(jù)中心的角度來看云計(jì)算,我們可以發(fā)現(xiàn)云計(jì)算的發(fā)展實(shí)際上也是數(shù)據(jù)中心演變的一個(gè)趨勢。上面動(dòng)態(tài)數(shù)據(jù)中心的許多特點(diǎn)和要求與我們前面章節(jié)討論的云計(jì)算有異曲同工之妙。動(dòng)態(tài)數(shù)據(jù)中心的資源利用符合云計(jì)算的共享理念,傳統(tǒng)數(shù)據(jù)中心中煙囪型的基礎(chǔ)設(shè)施要轉(zhuǎn)變?yōu)榭梢怨蚕淼馁Y源池。
一個(gè)理想的企業(yè)數(shù)據(jù)中心是完全集成的,不僅底層的基礎(chǔ)設(shè)施通過動(dòng)態(tài)數(shù)據(jù)中心解決方案形成一個(gè)統(tǒng)一的支撐平臺(tái),而且之上的應(yīng)用程序之間也通過面向服務(wù)的架構(gòu)(SOA)方式相互進(jìn)行整合,如圖4.4所示。下面是筆者認(rèn)為新型的動(dòng)態(tài)數(shù)據(jù)中心的一些服務(wù)變化。
從機(jī)架和服務(wù)器部署變成點(diǎn)擊和拖拽部署方式
從低利用率的裸機(jī)物理部署變成隨需應(yīng)變的虛擬資源部署
從專業(yè)人員的部署方式轉(zhuǎn)變成自服務(wù)方式
從復(fù)雜采購流程轉(zhuǎn)變?yōu)樽苑?wù)和資源快速部署和釋放[page]
從動(dòng)態(tài)數(shù)據(jù)中心到云計(jì)算
虛擬化和服務(wù)器整合是目前非常流行的項(xiàng)目,但這些都是相對比較小的技術(shù)項(xiàng)目而很難對整個(gè)企業(yè)IT產(chǎn)生深遠(yuǎn)和戰(zhàn)略性的改變。與一般只通過虛擬化來解決服務(wù)器正惡化問題相比,企業(yè)需要從整體上調(diào)整IT服務(wù)的方式。動(dòng)態(tài)數(shù)據(jù)中心不僅僅是技術(shù)的一個(gè)演變,更重要的是它代表了IT服務(wù)方式的變化。動(dòng)態(tài)數(shù)據(jù)中心結(jié)合了虛擬化、標(biāo)準(zhǔn)化硬件和自動(dòng)化管理,再加上一些架構(gòu)模型上的創(chuàng)新,從而使得面向服務(wù)的IT得以實(shí)現(xiàn)。IT服務(wù)管理上的可靠、靈活、低成本等目標(biāo)都可以通過動(dòng)態(tài)數(shù)據(jù)中心而得以實(shí)現(xiàn)。
動(dòng)態(tài)數(shù)據(jù)中心也可以看成是面向云計(jì)算服務(wù)的數(shù)據(jù)中心。根據(jù)前面討論的云計(jì)算內(nèi)容,我們知道云計(jì)算是從服務(wù)消費(fèi)者的角度產(chǎn)生的概念。這也就是為什么云計(jì)算有時(shí)也被認(rèn)為是IT作為服務(wù)的一種方式。而動(dòng)態(tài)數(shù)據(jù)中心是云計(jì)算服務(wù)的基礎(chǔ),它是從服務(wù)提供者角度產(chǎn)生的概念。無論是企業(yè)內(nèi)部IT還是第三方的公共服務(wù)提供商,他們作為服務(wù)的提供者都需要通過具體的動(dòng)態(tài)數(shù)據(jù)中心來提供服務(wù)。另外一個(gè)概念是綠色數(shù)據(jù)中心,這個(gè)概念主要指從建筑、電力、制冷等物理設(shè)施角度討論數(shù)據(jù)中心的建設(shè)問題。這幾個(gè)概念之間的關(guān)系如圖4.5所示。
雖然企業(yè)可以通過不同的方式進(jìn)行云計(jì)算的應(yīng)用,但是對于需要進(jìn)行私有云建設(shè)的企業(yè),筆者認(rèn)為建設(shè)動(dòng)態(tài)數(shù)據(jù)中心是他們進(jìn)行云計(jì)算實(shí)踐的一個(gè)核心。
1、基本架構(gòu)模型
動(dòng)態(tài)數(shù)據(jù)中心的構(gòu)建與傳統(tǒng)數(shù)據(jù)中心相比有比較大的差別。自動(dòng)化管理和高可用性需要通過一些新的技術(shù)手段和模型來實(shí)現(xiàn)。在討論微軟動(dòng)態(tài)數(shù)據(jù)中心方案之前,我們先來看幾個(gè)基本模型概念。
(1) 資源池。動(dòng)態(tài)數(shù)據(jù)中心的資源池是所有經(jīng)過虛擬化抽象之后的服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)等資源的集合。所有這些服務(wù)器從技術(shù)架構(gòu)上來看是同構(gòu)的,它們統(tǒng)一連接到網(wǎng)絡(luò)和存儲(chǔ)上去。根據(jù)實(shí)際需求,這些資源池中可能會(huì)分成不同的小組,以更方便地實(shí)現(xiàn)類似動(dòng)態(tài)在線遷移這樣的功能。當(dāng)用戶需要資源時(shí),資源從資源池中分配出去,當(dāng)資源使用完后被釋放回資源池。動(dòng)態(tài)數(shù)據(jù)中心通過軟件方式保障平臺(tái)的連續(xù)服務(wù),因此在實(shí)際采取維護(hù)工作之前可以允許資源池中有一定比例的壞節(jié)點(diǎn)存在。
(2) 物理故障域。物理故障域是當(dāng)上級(jí)硬件設(shè)備發(fā)生故障時(shí)會(huì)同時(shí)出錯(cuò)的一個(gè)服務(wù)器集合。比如位于同一個(gè)機(jī)架的服務(wù)器,當(dāng)這個(gè)機(jī)架的電源出現(xiàn)問題時(shí)可能造成整個(gè)機(jī)架上的服務(wù)器都無法正常工作。理解物理故障域?qū)τ趧?dòng)態(tài)數(shù)據(jù)中心的可靠性設(shè)計(jì)非常重要,在設(shè)計(jì)工作負(fù)載的時(shí)候需要跨越不同的故障域。另外在做物理設(shè)備更新和維護(hù)的時(shí)候也需要根據(jù)故障域的劃分來進(jìn)行。
(3) 升級(jí)域。升級(jí)域是一個(gè)會(huì)被同時(shí)升級(jí)的服務(wù)器的邏輯集合。升級(jí)域的想法主要是為了劃分資源池,從而使得在升級(jí)窗口時(shí)間內(nèi)可以依次輪流升級(jí)。這樣在做硬件升級(jí)或維護(hù)的時(shí)候,虛擬機(jī)環(huán)境可以從升級(jí)域中在線遷移到另一個(gè)環(huán)境,從而保證服務(wù)的連續(xù)性。
(4) 預(yù)留容量。為了保證所有應(yīng)用在做升級(jí)域維護(hù)或一個(gè)物理故障域出現(xiàn)問題的時(shí)候能夠正常運(yùn)行,數(shù)據(jù)中心需要在資源池中預(yù)留一部分資源。這部分資源的大小就是預(yù)留容量,實(shí)際上它的目的就是讓數(shù)據(jù)中心的資源有一個(gè)調(diào)配和周旋的余地。比如,假設(shè)數(shù)據(jù)中心有10個(gè)物理故障域,每個(gè)故障域中包含10臺(tái)服務(wù)器,那么客戶資源總分配就不能超過整個(gè)資源池的90%。
(5) 擴(kuò)展單元。數(shù)據(jù)中心的容量估算是一個(gè)相對困難的問題,因?yàn)槿绻麛?shù)據(jù)中心規(guī)模設(shè)計(jì)太大就會(huì)造成資源浪費(fèi),如果規(guī)模設(shè)計(jì)太小又會(huì)對業(yè)務(wù)發(fā)展造成掣肘。一般來說,隨著業(yè)務(wù)量的增長數(shù)據(jù)中心需要進(jìn)行容量擴(kuò)充。擴(kuò)展單元是一個(gè)事先定義好的用來擴(kuò)展數(shù)據(jù)中心的的單元,其中包含服務(wù)器、網(wǎng)絡(luò)設(shè)備、存儲(chǔ)、電源和制冷設(shè)備等。擴(kuò)展單元簡化了數(shù)據(jù)中心容量擴(kuò)充的工作,并能夠在一定程度上降低采購成本。擴(kuò)展單元是數(shù)據(jù)中心往模塊化方向發(fā)展的一種體現(xiàn)。
上面描述的架構(gòu)模型都是微軟動(dòng)態(tài)數(shù)據(jù)中心方案的一些實(shí)現(xiàn)要素,本章接下來的內(nèi)容將主要討論這個(gè)方案。
2、動(dòng)態(tài)數(shù)據(jù)中心方案
動(dòng)態(tài)數(shù)據(jù)中心解決方案是微軟提供的基于云計(jì)算思想的數(shù)據(jù)中心優(yōu)化和管理方案,其目標(biāo)是對傳統(tǒng)數(shù)據(jù)中心進(jìn)行虛擬化和云計(jì)算架構(gòu)的轉(zhuǎn)型,不斷提高IT基礎(chǔ)設(shè)施的靈活性、降低硬件、能源和空間等成本,從而讓企業(yè)能夠快速響應(yīng)業(yè)務(wù)需求,提高業(yè)務(wù)敏捷性。企業(yè)可以基于該方案快速構(gòu)建面向內(nèi)部使用的私有云平臺(tái),服務(wù)提供商也可以基于該方案在短時(shí)間內(nèi)搭建云計(jì)算服務(wù)平臺(tái)對外提供服務(wù)。動(dòng)態(tài)數(shù)據(jù)中心方案能夠讓用戶自己動(dòng)態(tài)管理數(shù)據(jù)中心的基礎(chǔ)設(shè)施(包括服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)等),包括開通、配置和安裝等。其核心價(jià)值在于,可以幫助用戶提高IT基礎(chǔ)設(shè)施資源的利用效率,提升基礎(chǔ)設(shè)施的應(yīng)用和管理水平,實(shí)現(xiàn)計(jì)算資源的動(dòng)態(tài)優(yōu)化。
動(dòng)態(tài)數(shù)據(jù)中心解決方案能夠幫助企業(yè)創(chuàng)建虛擬環(huán)境來運(yùn)行應(yīng)用,用戶可以按照需要彈性分配適當(dāng)?shù)膽?yīng)用配置,并且支持動(dòng)態(tài)擴(kuò)展。這個(gè)方案能夠幫助用戶實(shí)現(xiàn)數(shù)據(jù)中心的以下功能。
資源池管理:集中管理中心的硬件資源,包括服務(wù)器,存儲(chǔ)和網(wǎng)絡(luò)等。
動(dòng)態(tài)分配服務(wù):平臺(tái)可以動(dòng)態(tài)分配服務(wù)資源。
自助服務(wù)門戶:用戶可以根據(jù)需求自助申請計(jì)算資源,平臺(tái)根據(jù)SLA和用戶付費(fèi)情況,決定審批結(jié)果。
應(yīng)用和服務(wù)管理:應(yīng)用管理,服務(wù)度量計(jì)費(fèi)和SLA等。
服務(wù)的保障:數(shù)據(jù)存儲(chǔ)和災(zāi)備服務(wù)。
3、動(dòng)態(tài)數(shù)據(jù)中心的整體架構(gòu)
動(dòng)態(tài)數(shù)據(jù)中心解決方案從邏輯架構(gòu)上來看可以分成下面四層。
(1) 資源層。
資源層是服務(wù)器、網(wǎng)絡(luò)和存儲(chǔ)等設(shè)備的集合,是一個(gè)融合了各種物理IT資源的基礎(chǔ)層。這里的網(wǎng)絡(luò)設(shè)備包括物理網(wǎng)關(guān)、路由器和防火墻等。存儲(chǔ)設(shè)備是動(dòng)態(tài)數(shù)據(jù)中心對外提供虛擬磁盤空間的基礎(chǔ),這些存儲(chǔ)設(shè)備都是通過高速以太網(wǎng)或光纖連接在一起,從而保障了虛擬機(jī)的可移動(dòng)性。在傳統(tǒng)的數(shù)據(jù)中心中,由于建設(shè)時(shí)間和不同應(yīng)用的差異等造成硬件平臺(tái)差異比較大,而動(dòng)態(tài)數(shù)據(jù)中心由于采用了虛擬化技術(shù),服務(wù)器之間差異的必要性將不存在。因此,企業(yè)可以選擇同一技術(shù)架構(gòu)的服務(wù)器,從而不再需要管理各種不同的硬件平臺(tái)、BIOS版本、備件等。通過標(biāo)準(zhǔn)化開發(fā)、測試和生產(chǎn)環(huán)境的硬件環(huán)境,可以大大降低管理的復(fù)雜度和成本,并減少出錯(cuò)的概率。另外一個(gè)附加的好處是,由于采購量的變化,企業(yè)還可以通過這種方式降低采購成本。
(2) 虛擬化層
虛擬化層是平臺(tái)的核心之一,主要提供對物理設(shè)備的抽象以及未來對應(yīng)用的虛擬化能力。在這一層,動(dòng)態(tài)數(shù)據(jù)中心能夠集成多種虛擬化技術(shù)和來賓操作系統(tǒng)(Guest OS)。動(dòng)態(tài)數(shù)據(jù)中心的硬件虛擬化主要是基于微軟Hyper-V 的虛擬化技術(shù),同時(shí)可以集成第三方的虛擬化環(huán)境,比如VMware的ESX等。通過利用像Hyper-V中在線遷移這樣的功能,應(yīng)用程序虛擬化最開始時(shí)針對客戶端計(jì)算機(jī)應(yīng)用程序的部署問題,但是隨著數(shù)據(jù)中心中服務(wù)器的增加,這個(gè)技術(shù)已經(jīng)逐漸應(yīng)用到了服務(wù)器端應(yīng)用程序的自動(dòng)化部署。另外,根據(jù)最終用戶的需要,動(dòng)態(tài)數(shù)據(jù)中心可以同時(shí)提供基于Windows的虛擬化環(huán)境或者基于Linux的虛擬化環(huán)境。
(3) 管理層。
虛擬化技術(shù)的出現(xiàn)一方面提升了資源的利用率和部署的靈活性,另一方面也為管理帶來了挑戰(zhàn)。管理層主要是提供對虛擬化資源、物理資源的管理能力以及負(fù)載均衡等網(wǎng)絡(luò)服務(wù)能力,包括對計(jì)算資源的自動(dòng)配置、動(dòng)態(tài)分配、系統(tǒng)的備份和監(jiān)控等。一般來說,這一層的功能不會(huì)直接開放給最終用戶以及系統(tǒng)管理員,而是將能力提供給最上層的服務(wù)層,由服務(wù)層的相關(guān)功能來完成資源管理能力的集成,盡可能屏蔽用戶對不同資源管理能力的要求。
(4) 服務(wù)層。
服務(wù)層包括兩個(gè)方面:核心的系統(tǒng)管理服務(wù)和服務(wù)層門戶。核心的系統(tǒng)管理服務(wù)主要是指將管理平臺(tái)的能力通過標(biāo)準(zhǔn)的編程接口對外提供服務(wù)。這些標(biāo)準(zhǔn)的編程接口可以給其他應(yīng)用使用,另外服務(wù)層門戶也是通過這些編程接口與管理層進(jìn)行集成的。服務(wù)層門戶主要包括自助服務(wù)門戶和管理門戶。前者提供給平臺(tái)用戶使用,可以讓用戶完成產(chǎn)品的訂購、資源的調(diào)整、提交服務(wù)申請等功能;后者提供一個(gè)集成的系統(tǒng)管理員功能,用于完成對資源的分配、審核、服務(wù)開通和系統(tǒng)安全保障等。
{{item.content}}