有朋友就職于一家中型企業(yè)的IT部門,雖然也Manager的title,但他總覺得自己的潛力沒能充分發(fā)揮,不甘心只做些別人眼里“網(wǎng)管”的初級(jí)工作。先避開工作要保持平常心這件事,我問他是否聽說過“存儲(chǔ)經(jīng)理人”,他搖搖頭。其實(shí)作為和“網(wǎng)管”相對(duì)應(yīng)的概念,“存儲(chǔ)經(jīng)理人”早就六七年前就被調(diào)研公司Gartner提出來,但由于普及推廣的不夠,對(duì)很多人來說還非常陌生,簡單來說,它有兩層含義,第一層是指存儲(chǔ)經(jīng)理人需要精通存儲(chǔ)設(shè)備并對(duì)其作出管理和決策,第二層是指存儲(chǔ)經(jīng)理人需要根據(jù)數(shù)據(jù)產(chǎn)生、堆積、存儲(chǔ)的情況來對(duì)公司的決策和和業(yè)務(wù)決策起到幫助甚至是決定的作用。
之所以和他談到“存儲(chǔ)經(jīng)理人”這個(gè)概念,是想告訴他,第一,IT系統(tǒng)的管理絕不僅僅限于網(wǎng)絡(luò)管理,服務(wù)器與存儲(chǔ)的管理也是不可或缺的組成部分。第二,希望有更好的職業(yè)發(fā)展前景肯定是正確的,但也要積極挖掘現(xiàn)有工作的價(jià)值。
“那存儲(chǔ)經(jīng)理人和網(wǎng)管有什么區(qū)別???都做哪些事兒?有什么發(fā)展前景?”針對(duì)他或者類似朋友們的疑問,回答如下:存儲(chǔ)經(jīng)理人也好,存儲(chǔ)管理員也罷,可能會(huì)涉及到的工作有以下幾個(gè)方面:
一、存儲(chǔ)系統(tǒng)相關(guān)的管理:包括各種各樣的DAS、SAN、NAS存儲(chǔ)系統(tǒng)(磁盤陣列)和里面使用的驅(qū)動(dòng)器,以及存儲(chǔ)虛擬化設(shè)備等。對(duì)于RAID陣列而言,在幾年前有人認(rèn)為只要讓它們能夠正常工作,通過基本的管理功能在平時(shí)監(jiān)視其狀態(tài)就好了。不過,現(xiàn)在的存儲(chǔ)系統(tǒng)軟件功能越來越豐富,在使用這些提高存儲(chǔ)效率之前,還需要經(jīng)過一個(gè)了解——分析/評(píng)估——預(yù)部署/測試的過程。
自動(dòng)精簡配置
自動(dòng)精簡配置(Thin Provisioning)的工作原理是:在創(chuàng)建“瘦”卷時(shí),預(yù)分配一個(gè)虛擬的邏輯卷容量大小,而只是在實(shí)際寫入數(shù)據(jù)時(shí)才分配物理空間給這個(gè)卷。這樣我們可以輕易的創(chuàng)建出總邏輯容量超出物理磁盤空間的多個(gè)“精簡卷”,而無須為將來可能達(dá)到的數(shù)據(jù)量提前“買單”。在應(yīng)用產(chǎn)生的數(shù)據(jù)確實(shí)需要增加驅(qū)動(dòng)器時(shí),我們也可以靈活地在線調(diào)整卷的大小。我們在享受自動(dòng)精簡配置帶來好處的同時(shí),也要投入一定的管理精力在上面,或者說熟悉它的規(guī)則。
自動(dòng)分層存儲(chǔ)
自動(dòng)分層存儲(chǔ)技術(shù)通過將頻繁訪問的“熱”數(shù)據(jù)移動(dòng)到高速且昂貴的SSD固態(tài)驅(qū)動(dòng)器或者15K RPM機(jī)械硬盤,而將訪問頻率較低的“冷”數(shù)據(jù)存放在大容量/廉價(jià)的7200RPM近線驅(qū)動(dòng)器中,來實(shí)現(xiàn)改善存儲(chǔ)效率、提高性能和降低單位容量成本的作用。
自動(dòng)分層存儲(chǔ)當(dāng)然給企業(yè)帶來了很大的幫助,不過同時(shí)也需要存儲(chǔ)經(jīng)理人在規(guī)劃、實(shí)施和后期管理/監(jiān)控過程中投入一部分精力。
存儲(chǔ)虛擬化
總的來說,存儲(chǔ)虛擬化設(shè)備是介于存儲(chǔ)網(wǎng)絡(luò)中間的一層,將后端連接的存儲(chǔ)系統(tǒng)虛擬化整合起來、集中管理,并可以在上面統(tǒng)一執(zhí)行自動(dòng)精簡配置、快照/復(fù)制/鏡像保護(hù),還有分層存儲(chǔ)等功能。
快照、復(fù)制和鏡像
如今,快照、復(fù)制和鏡像這些基本的數(shù)據(jù)保護(hù)功能幾乎已經(jīng)成了高、中、低端企業(yè)級(jí)存儲(chǔ)系統(tǒng)的標(biāo)配——譬如IBM去年發(fā)布的中端存儲(chǔ)產(chǎn)品Storize V7000。
作為一種簡單的本地?cái)?shù)據(jù)保護(hù)方式,快照主要用來應(yīng)對(duì)一段時(shí)間(比如幾分鐘或一個(gè)月)之內(nèi)的邏輯錯(cuò)誤。它不等同于備份,因?yàn)楸槐Wo(hù)的數(shù)據(jù)內(nèi)容仍然在這臺(tái)存儲(chǔ)設(shè)備上面,在需要的時(shí)候我們可以切回到某一時(shí)間的快照點(diǎn),或者刪除不再需要的快照來釋放磁盤空間。快照還可以作為磁盤陣列之間的復(fù)制的基礎(chǔ),比如像IBM存儲(chǔ)系統(tǒng)可選的FlashCopy,就可將FlashCopy快照與Tivoli Storage Manager備份軟件的功能結(jié)合使用。
所謂同步鏡像,就是2臺(tái)存儲(chǔ)上保存的內(nèi)容完全一致。如果說本地鏡像的目的是進(jìn)一步避免單點(diǎn)故障(盡管存儲(chǔ)系統(tǒng)的控制器、驅(qū)動(dòng)器和電源等組件已經(jīng)帶有冗余了),那么遠(yuǎn)程鏡像就是為了容災(zāi),或者是像IBM SVC那樣長距離的VMware服務(wù)器虛擬機(jī)實(shí)時(shí)遷移。鏡像功能對(duì)存儲(chǔ)網(wǎng)絡(luò)的帶寬和延遲的要求很高,如果達(dá)不到就會(huì)嚴(yán)重拖慢被保護(hù)系統(tǒng)的讀寫性能。
二、存儲(chǔ)網(wǎng)絡(luò)相關(guān)的管理:主要是FC交換機(jī)及其連接,有時(shí)也會(huì)涉及到以太網(wǎng)交換機(jī),特別是支持FCoE的10GbE融合網(wǎng)絡(luò)交換機(jī)。這部分還應(yīng)包括大型機(jī)(Main Frame)環(huán)境中的存儲(chǔ)網(wǎng)絡(luò)。
FCoE(以太網(wǎng)光纖通道)
在傳統(tǒng)數(shù)據(jù)中心環(huán)境中,通常是存儲(chǔ)小組負(fù)責(zé)維護(hù)FC SAN,網(wǎng)絡(luò)小組負(fù)責(zé)維護(hù)以太網(wǎng)LAN,這兩個(gè)組是彼此獨(dú)立的,引入FCoE后可能會(huì)給IT運(yùn)營分工帶來一些變化。
數(shù)據(jù)中心的文化、政治、組織結(jié)構(gòu)和現(xiàn)有配置都可能會(huì)給推行FCoE帶來阻力,有時(shí)必須引入新的業(yè)務(wù)流程和程序,確保適當(dāng)?shù)目刂茩C(jī)制,才能保證FCoE的成功部署和運(yùn)營,采購模式也可能發(fā)生變化,傳統(tǒng)以太網(wǎng)網(wǎng)絡(luò)的可靠性也需要增強(qiáng)。
隨著FC和以太網(wǎng)網(wǎng)絡(luò)的融合,傳統(tǒng)上相互獨(dú)立的兩個(gè)網(wǎng)絡(luò)運(yùn)維小組也需要融合,但實(shí)施FCoE并不需要特殊的IT培訓(xùn),運(yùn)維人員可以充分利用已掌握的技能,存儲(chǔ)小組繼續(xù)負(fù)責(zé)維護(hù)SAN,網(wǎng)絡(luò)小組繼續(xù)負(fù)責(zé)數(shù)據(jù)網(wǎng)絡(luò)的運(yùn)維。
三、數(shù)據(jù)保護(hù)相關(guān)軟硬件的管理:磁帶機(jī)/帶庫、帶有重復(fù)數(shù)據(jù)刪除功能的VTL、NAS磁盤備份設(shè)備、備份/CDP軟件等。
由于磁帶庫中包含機(jī)械手、步進(jìn)電機(jī)等大量活動(dòng)部件,因此出現(xiàn)的問題中最多的應(yīng)該是機(jī)械故障,這就給保修期內(nèi)和保外的維護(hù)工作提出了一定的要求在請維修人員到達(dá)現(xiàn)場之前,還可以使用帶庫管理軟件(比如Quantum iLayer等)的診斷和糾正功能,對(duì)無法自己恢復(fù)的故障部分進(jìn)行定位。因此熟悉和了解磁帶設(shè)備的工作原理對(duì)管理人員還是有一定好處的。
重復(fù)數(shù)據(jù)刪除的使用就更要下功夫研究了,比如說可能對(duì)備份性能產(chǎn)生的影響、不同數(shù)據(jù)類型的縮減效果、全備份/增量備份中的冗余數(shù)據(jù)比例……
備份和CDP之類的數(shù)據(jù)保護(hù)軟件對(duì)于大多數(shù)企業(yè)來說也是不可或缺的。選擇的標(biāo)準(zhǔn)還是要建立在用戶對(duì)不同產(chǎn)品的功能特點(diǎn)了解和比較的基礎(chǔ)上,或者說更多的還要看相關(guān)人員在備份方面的工作經(jīng)驗(yàn)。
如果是對(duì)數(shù)據(jù)庫應(yīng)用之類的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行備份,有些公司可能會(huì)讓數(shù)據(jù)庫工程師來兼管這部分的工作;若是以圖像、視頻、音頻等類型為主的非結(jié)構(gòu)化數(shù)據(jù),它們產(chǎn)生和增長的速度很快,如果沒有專人負(fù)責(zé)或者專門抽出一部分精力,對(duì)于數(shù)據(jù)規(guī)模較大的企業(yè)來說恐怕不太容易處理好這部分工作。
四、文件系統(tǒng)的管理:即對(duì)大規(guī)模分布式文件系統(tǒng)(或稱集群文件系統(tǒng))、云存儲(chǔ)等。
分布式文件系統(tǒng)因?yàn)锳mazon S3、Google GFS這些公共云存儲(chǔ)應(yīng)用而再次受到人們的重視。另外一些Internet服務(wù)提供商,比如Facebook、國內(nèi)的淘寶等都因?yàn)閼?yīng)用的需求而產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù),對(duì)此,自主研發(fā)分布式文件系統(tǒng)是一種比較合適,總體成本較低的解決方案。比如上海盛大在線計(jì)劃在雅虎開源的Hadoop分布式文件系統(tǒng)基礎(chǔ)上進(jìn)行開發(fā),淘寶的TFS經(jīng)過1.0版本之后還要不斷升級(jí)2.0、3.0…。這些都需要投入一定的人力等資源進(jìn)行研發(fā)和維護(hù)方面的工作。
如此的實(shí)現(xiàn)方式,在應(yīng)用上與集群NAS有些類似,不過分布式文件系統(tǒng)的軟硬件是分開的,而集群NAS則相當(dāng)于把它們打包在一起。具體應(yīng)該選擇哪種?要根據(jù)數(shù)據(jù)的規(guī)模、重要性以及用戶自己的開發(fā)集成能力等方面來考慮。
負(fù)責(zé)以上所說的文件系統(tǒng)相關(guān)工作的人員,可能被歸屬于軟件(開發(fā))工程師之類的職位,但他們的工作是和存儲(chǔ)、數(shù)據(jù)管理密切相關(guān)的,因此稱為存儲(chǔ)工程師也不為過。
說了這么多,可能大家所在公司對(duì)存儲(chǔ)的需求各有不同,工作分工也相應(yīng)地不一樣。但無論如何,優(yōu)秀的存儲(chǔ)經(jīng)理人由于對(duì)企業(yè)IT運(yùn)營、數(shù)據(jù)安全和存儲(chǔ)效率等方面的重要意義越來越受到公司的重視,當(dāng)然,職業(yè)發(fā)展前景也會(huì)越來越好
|