
數據中心最佳實踐介紹
數據中心(xin)存(cun)在的(de)唯一最(zui)重(zhong)要的(de)原因是(shi)保持(chi)托管在其中的(de)服(fu)務(wu)以(yi)及(ji)從中分發的(de)服(fu)務(wu)的(de)可用性(xing)。這些(xie)基于建筑(zhu)物內的(de)IT設備(bei),它需要四個關鍵(jian)資源,包括安全性(xing),網(wang)絡彈性(xing)以(yi)及(ji)電源和(he)散(san)熱(re)的(de)連續性(xing)。
數(shu)據中(zhong)心運營(ying)商必須盡可(ke)能(neng)以(yi)最(zui)節(jie)能(neng)和(he)最(zui)具成本效益的(de)(de)方式(shi)保持此(ci)(ci)服(fu)務的(de)(de)可(ke)用(yong)(yong)性。以(yi)下系列文章介(jie)紹了旨(zhi)在(zai)實(shi)(shi)(shi)現此(ci)(ci)目標的(de)(de)經過實(shi)(shi)(shi)踐檢驗的(de)(de)實(shi)(shi)(shi)踐。目的(de)(de)是強調行(xing)業領先(xian)的(de)(de)最(zui)佳實(shi)(shi)(shi)踐,最(zui)著名的(de)(de)方法和(he)行(xing)為,應在(zai)任(ren)何(he)數(shu)據中(zhong)心站點上一致地(di)應用(yong)(yong)該軟(ruan)件,以(yi)實(shi)(shi)(shi)現此(ci)(ci)目標。
數據中心運營和管理
如上所(suo)述,數據中心是(shi)建筑(zhu)(zhu)物(wu)(wu)或建筑(zhu)(zhu)物(wu)(wu)的(de)隔(ge)離區域(yu),其(qi)唯一(yi)目的(de)是(shi)提供(gong)安全,高可(ke)用(yong)性和可(ke)靠的(de)IT服務。為(wei)了獲(huo)得高(gao)可(ke)用(yong)性的(de)服務,站點的(de)基礎架構和操(cao)(cao)作(zuo)需要(yao)緊密同步,并(bing)與政策,程序(xu),人(ren)員和培訓密切(qie)相關,并(bing)加以記(ji)錄,以識(shi)別和減輕可(ke)能導致(zhi)服務中斷(duan)或威脅服務連續性的(de)任何(he)風險(xian)。為(wei)了實現長期可(ke)靠性,必須(xu)以高(gao)標(biao)準(zhun)操(cao)(cao)作(zuo)和維護數(shu)據中心設施,并(bing)且必須(xu)識(shi)別,記(ji)錄所有潛在風(feng)險并制定適當的緩(huan)解計(ji)劃。
操作(zuo)風(feng)險(xian)很難建模(mo)和量(liang)化,因為它(ta)直(zhi)接關系到操作(zuo)人員(yuan)的(de)(de)能力,他們所接受(shou)培訓的(de)(de)充(chong)分性以及有效的(de)(de)措(cuo)施或適(shi)當的(de)(de)流程。為了最大程度地降低操作(zuo)風(feng)險(xian),操作(zuo)和維護人員(yuan)必須(xu)具有操作(zuo)設施中所包含(han)設備的(de)(de)適(shi)當資格。
維護(hu)質量(liang)對(dui)于任何數據中心的(de)可靠(kao)運行都(dou)至關重要(yao)。所有維護(hu)活動均(jun)應(ying)(ying)完(wan)整(zheng)記(ji)錄(lu)(lu),并應(ying)(ying)保留(liu)(liu)平均(jun)故障間(jian)隔時間(jian)(MTBF)和(he)平均(jun)維修(xiu)時間(jian)(MTBR)記(ji)錄(lu)(lu),以進行生(sheng)命周期分析。應(ying)(ying)要(yao)求(qiu)供應(ying)(ying)商保留(liu)(liu)此類信(xin)息的(de)記(ji)錄(lu)(lu),并應(ying)(ying)要(yao)求(qiu)提供這些(xie)記(ji)錄(lu)(lu)。這將提高風險分析和(he)績效趨勢研究的(de)準確(que)性。
人員配置
數(shu)據中心(xin)運(yun)營團隊通常由來自(zi)多(duo)個(ge)組(zu)織或部門的個(ge)人組(zu)成,每個(ge)人都有自(zi)己(ji)的范圍和職責。
明確定義和(he)記錄這些角(jiao)色和(he)職責對于(yu)成功的數據中心運營(ying)至(zhi)關重(zhong)要。責任分立(li)或不確定會增(zeng)加風險(xian),尤其(qi)是在(zai)復雜的運營(ying)環境(jing)中。因此,一開始(shi)就應非(fei)常清楚地記錄所有責任領域,報告路線和(he)升級機制,并向所有各方(fang)明確。
與(yu)特定(ding)(ding)建筑區域(辦公(gong)室/廠房等(deng))有關(guan)的(de)所有責任也應(ying)非常明確(que)地定(ding)(ding)義和(he)(he)詳細說(shuo)明。這些應(ying)擴展到(dao)所有IT,安全和(he)(he)設施人(ren)員(yuan)和(he)(he)主要(yao)供應(ying)商(shang)。明確(que)確(que)定(ding)(ding)責任和(he)(he)組(zu)織仍然是(shi)“最佳運(yun)營(ying)(ying)最佳實踐”總體制度的(de)組(zu)成部分(fen),因此(ci),對現場運(yun)營(ying)(ying)感興趣的(de)各個個人(ren),團體,部門和(he)(he)組(zu)織的(de)明確(que)責任界定(ding)(ding)對于運(yun)營(ying)(ying)績效至關(guan)重要(yao)。
所有(you)現場操(cao)作人員都(dou)應受過(guo)良(liang)好的(de)(de)(de)(de)訓練和良(liang)好的(de)(de)(de)(de)實踐,有(you)信心并有(you)能(neng)力操(cao)作現場基礎(chu)架構(gou),包括(kuo)在任何時候甚至在壓力很大的(de)(de)(de)(de)事件(例如可能(neng)導(dao)致服(fu)務中(zhong)斷的(de)(de)(de)(de)設(she)備故障)期間(jian)。具體來(lai)說(shuo),應由現場安裝的(de)(de)(de)(de)設(she)備的(de)(de)(de)(de)供應商(shang)對人員進行培訓,以確(que)保最高程度的(de)(de)(de)(de)培訓和理(li)解。重要的(de)(de)(de)(de)是在新(xin)設(she)備的(de)(de)(de)(de)招(zhao)標中(zhong)要考慮到(dao)這(zhe)一點。一個運行良(liang)好(hao)的數(shu)據中心(xin)將始終考慮與站點(dian)運營和(he)管理相(xiang)關的人為因素。
數據中心運(yun)營的可用性和可靠性
可(ke)用性(xing)和可(ke)靠性(xing)對于任何(he)數據中心的(de)運營都是(shi)至關重要的(de),但是(shi)如何(he)定義和衡量它們呢?以下部分提供了該領域的(de)一些基本(ben)知(zhi)識(shi)。
可靠性
在給定(ding)的環境中,出于(yu)特定(ding)目的,在指定(ding)時(shi)間內無故(gu)障系統運行的可能性
可用性(xing)
系(xi)統(tong)在某個(ge)時間點將(jiang)能夠運(yun)行并能夠提供所請求的服務的概率始(shi)終以正常運(yun)行時間與停機時間的百分比來衡量;越接近100%越好。
可用性(xing),以其(qi)最簡單的形式:A =正常(chang)運行時間/(正常(chang)運行時間+停機(ji)時間)可(ke)(ke)(ke)用(yong)性(xing)(xing)(xing)是(shi)系(xi)統運行時的(de)時間(jian)(jian)百分(fen)比(bi)。組件的(de)可(ke)(ke)(ke)用(yong)性(xing)(xing)(xing)可(ke)(ke)(ke)通(tong)過以(yi)下公式獲得(de)。與可(ke)(ke)(ke)用(yong)性(xing)(xing)(xing)和可(ke)(ke)(ke)靠(kao)(kao)性(xing)(xing)(xing)有(you)關(guan),但與眾不(bu)同,可(ke)(ke)(ke)用(yong)性(xing)(xing)(xing)考慮了(le)系(xi)統停(ting)止(zhi)服務的(de)時間(jian)(jian),如果重新啟(qi)動時間(jian)(jian)短,則不(bu)可(ke)(ke)(ke)靠(kao)(kao)的(de)系(xi)統可(ke)(ke)(ke)能具有(you)較高的(de)可(ke)(ke)(ke)用(yong)性(xing)(xing)(xing)(在數據(ju)中(zhong)心(xin)中(zhong)無(wu)用(yong),尤其(qi)是(shi)在電源方面(mian))可(ke)(ke)(ke)用(yong)性(xing)(xing)(xing)提供(gong)有(you)關(guan)時間(jian)(jian)使用(yong)的(de)信(xin)息。可(ke)(ke)(ke)靠(kao)(kao)性(xing)(xing)(xing)提供(gong)有(you)關(guan)無(wu)故障間(jian)(jian)隔的(de)信(xin)息。