1、存儲這十年
眨眼間,擔任存儲產品設計規劃工作已經一年多了,對存儲系統的發展有了一些感觸。在2002~2009這7年里,應該說是存儲行業在中國落地生根的時期,那時候國內有不少工程師活躍在各種技術論壇,討論存儲系統的基本原理、部署配置等。我記得那段時間內,IBM從LSIOEM過來的FAStT系列的存儲系統在國內被廣泛使用,技術論壇里基本都是關于這個系列存儲系統的討論。高端存儲的討論則基本聚焦在IBM的Shark系列,當時國內對EMC以及HDS等專業存儲公司的產品的關注和探討明顯不如IBM,一個重要原因是因為IBM的存儲大量隨其服務器捆綁,而EMC和HDS這兩家公司當時只有存儲產品。再后來就是FAStT的換代產品DS4000系列,再后來就是DS5000,這幾代產品均是OEM自LSI,本質上其實就是一個硬件規格不斷提升的過程。然而,存儲行業就像一個人的成長過程,首先要長身體,但是身體長到一定階段,就需要長心智了。隨著上層業務的多樣化發展,底層存儲不僅僅再只是一個提供數據存儲的盒子,它需要一些靈活易用的數據管理功能來豐富它的價值,比如快照克隆、擴容復制、壓縮重刪、超供回收以及虛擬化等等。
在中國,存儲從業人員水平也在不斷的提高。從這10年期間國內的幾個著名存儲論壇討論的課題便可以看出,從當初的一知半解,還在討論所謂SAN、FC、光纖這三者的概念和區別的階段,一直到后來討論起各廠商中高端存儲設備的內部架構以及各種數據管理特性原理、實現、價值及應用場景,隨后更進一步,討論起存儲系統的選型、部署和規劃管理等。我相信隨著國內業界對存儲的不斷認知和積累,首先是廠商與集成商,隨后便會是終端客戶,隨著從業人員水平的提高,終端客戶越來越難忽悠,這樣就會形成更加專業的氣氛和促使國內廠商不斷自主研發進取的動力。
十年間,細數存儲廠商的變遷。IBM在2008年將早先收購的XIV推向了市場,并且定位在高端存儲級別,引起了不小的轟動,這是個里程碑式的事件,它不僅象征著傳統高端存儲的封閉式架構土崩瓦解,而且還引起了一股Scale-Out熱。緊其隨后,EMC把經營了多年的傳統高端SymmetrixDMX系列的核心軟件遷移到了開放式硬件平臺上,推出了新一代Scale-Out高端存儲系統SymmetrixV-Max;之后一年HDS也按耐不住,將其傳統高端存儲USPV也遷移到了開放硬件平臺,變身成了VSP存儲系統,也宣稱為Scale-Out架構,但是VSP并不是十分開放,其形態上我認為依然是傳統高端的封閉式架構,但是CPU從PowerPC變成了Intelx86,同時保留ASIC芯片,外觀上采用大背板,CPU、內存、IO板分離式熱插拔,這些依然還是傳統高端存儲系統的元素。
2011年,EMC將其Celerra產品當做機頭,后端掛接Clariion存儲,包裝成了VNX系列,當然硬件平臺是升級之后的。這個產品沒有什么本質創新。但是其同時推出了一款低端的VNXe系列,這款產品看似低端,其實暗藏玄機。在筆者在今年3月份的一篇文章《VNXe會給存儲系統帶來顛覆性變革么》中詳細剖析了VNXe內部并且做出推斷,存儲+虛擬機就是百變金剛。存儲+計算,即應用存儲很有可能會是后續外置存儲系統的發展方向。果不其然,9月份的VMwareWorld大會上,EMC毫無遮攔的表述了這個觀點,存儲直接運行虛擬機,直接與應用結合,搶占部分服務器市場。(作者:冬瓜頭(張冬),《大話存儲》及《大話存儲2》作者)在應用存儲這方面國內某軟件公司就頗具前瞻性。
2010年,IBM將其多個產品的多個模塊進行了堆疊組合,形成了StorwizeV7000中端存儲產品,這款產品可以說是IBM真正自研的第一款中端存儲系統。EMC在經歷了SymmetrixV-Max變革之后,在中端存儲系統產品線,也將其CX系列做了終結,換面為VNX系列,后者實則是CX系列升級的硬件版本加上CelerraNAS機頭組合而成的一款所謂Scale-Out的統一存儲。
就在本月,HP也成功的將收購的3PAR存儲硬件升級之后包裝為P10000產品型號。
說道統一存儲,不得不說的則是NetApp。作為EMC的頭號對手(存儲界僅剩的三家專業聚焦存儲的巨頭為EMC、NetApp、HDS),NetApp是一個老牌存儲公司了,上世紀九十年代靠獨立NAS起家(取代當時的Linux服務器做NFS共享的方式),本世紀初通過在文件系統上虛擬塊空間從而支持了塊級訪問,并包裝為“UnifiedStorage”概念,廣受業界追捧,統一存儲的概念一直到現在還沒退火。NetApp憑借其強大的增值功能和簡便的配置占據了NAS市場老大的位置。從最早期的FAS270、FAS980,到后來的FAS2000、FAS3000和FAS6000,再到后來的FAS3100,一直到最近的FAS3200和FAS6200,NetApp在硬件平臺上遷移的很平穩,形態上沒有什么大動(除了最近的FASx200系列平臺支持IO擴展柜之外)。NetApp的核心競爭力在于其軟件,它沒有精力去自己搞出類似某公司那樣的十幾款硬件盒子形態,這樣做對它沒有任何意義。從其Ontap7.0操作系統開始,支持Flexvol特性,這也是存儲業界(作者:冬瓜頭(張冬),《大話存儲》及《大話存儲2》作者)第一個Thin技術的原型,但是Thin這個詞好像卻并不是NetApp推廣出來的。其核心層WAFL文件系統是一個非常強大的角色,號稱“Thelastwordinfilesystem”的ZFS就是借鑒了WAFL的思想并在多方面進行改良的文件系統,以及變種BTRFS。
2008年的存儲界還有另一件大事,本文筆者的專著,一本里程碑式的著作《大話存儲–網絡存儲系統原理精解與最佳實踐》出版了,它是第一本將存儲系統基本概念和原理清晰透徹進行表述的存儲書籍,在業界引起了廣泛好評,讓不計其數的初學者快速入了門,為國內存儲行業迅速孵化了一大批存儲潛在人才。兩年后,《大話存儲2》也順利出版了,大話2厚度超過900頁,可以說是存儲界前所未有之鴻篇巨著,其內容涉及了存儲技術的方方面面,甚至在國內學術界也獲得了高度評價,并且成功進入了各大院校的專業課程教材體系,同時也成為了各大國內集成商以及存儲廠商研發人員手頭必備的書籍;同時也受到不少美國硅谷存儲界人士的好評。
然而,看似紅紅火火的存儲市場,即將迎來的可能會是一個嚴酷的冬天。
2、存儲下一個十年
書接上文。從存儲產品形態變化可以看得出來,在硬件形態上,高端存儲傳統架構崩塌,轉為開放式架構,那么存儲與服務器架構已經沒有本質區別,這一步的變化已經奠定了外置存儲系統體系走(作者:冬瓜頭(張冬),《大話存儲》及《大話存儲2》作者)向崩塌的基礎。一個事物總是要向前發展,傳統雙控存儲系統在大架構體系上已經沒有可以拿得出手的搞頭了,所以不得不向Scale-Out架構來發展,就像CPU多核化一樣,上百核的CPU都已經可以商用了,那么對于存儲系統來說,Scale-Out的下一步又會是什么呢?在沒有革命性新技術出來之前,我認為外置存儲也就只能這樣了,無非就是硬件規格、接口速率的提升過程,激進一些可能直接以磁盤為單位來做Scale-Out,讓控制器節點數達到系統內的硬盤數量級,而每個控制器節點規格可以降低,但是這始終還是Scale-Out。
那么我到底想說什么呢?憑什么我認為外置存儲系統后續日子會越來越難過?這還得從最近的兩個東西說起,一個是固態存儲介質,另一個,則是炒得火熱的云。
2.1存儲與服務器同質化
上一代存儲產品在硬件上還是頗具特色的,尤其是以EMCSymmetrix和HDSUSP為代表的高端平臺,大背板上安插CPU板、內存板、IO板等。而且上一代高端普遍使用PowerPC處理器。上一代中端產品,到處可覓見ASIC的身影,比如IBMDS4000/DS5000,HDSAMS2000等。而到了這一代,Intel處理器x86硬件平臺似乎已經統治了從高端到中端甚至中低端的存儲陣列,內部架構與普通x86PC服務器無異,只是外觀以及其他一些專門為硬盤槽位以及維護性考慮的細節上略有不同。只有低端一些產品依然使用ASIC來降低成本。
外置存儲發展到這個階段,已經在硬件上失去了它獨立發展的“借口”。其次,在軟件上,外置存儲的借口也越來越脆弱。隨著各種卷管理軟件,比如傳統的LVM、CLVM甚至GLVM以及Windows平臺下的動態卷越做越強,還有Symantec從Veritas繼承下來的馳騁多年依然寶刀未老的VxVM以及StorageFoundation平臺,再加上號稱“Thelastwordinfilesystem”的ZFS以及其變種Btrfs,甚至原Sun公司的統一的存儲軟件ComStar等平臺,這些角色的發展對于傳統外置存儲的軟件層來講,都是威脅。比如ZFS,容錯保護、數據校驗糾錯、快照、Thin、Dedup、Clone、Replication等外置存儲用來增值的特性,它也都已經集成了,只要將其架設到JBOD或者服務器自帶存儲介質上即可形成一個差不多的存儲系統,既可以用作自身使用,也可以通過SCSITarget向外部提供存儲空間成為一個獨立的存儲設備。
2.2固態存儲介質終將一統
固態存儲介質的好處就不必多講了,想必大家都很了解。固態存儲介質遲早會取代機械磁盤,這也是大勢所趨,雖然短期內不太可能,但是不排除若干年之后不會發生。固態存儲介質的可靠性、容量、存儲密度以及成本均會越來越變得讓人容易接受。機械磁盤屆時已經沒有必要存在,而磁帶可能相對于機械磁盤稍晚些一樣會被固態存儲介質所替代。Flash硅片也有不同的規格等級,使用低規格大容量的Flash陣列完全可以提供比傳統物理帶庫或者VTL更劃算的備份介質。這樣,從RAM到歸檔設備一條路下來就不會有任何機械部件存在,而且性能和成本可以是平滑下降的。
我曾經在某客戶機房看到過某公司高端存儲產品,占用了整整一個機柜的空間,風扇呼呼的吹著,噪音讓人頭疼,結果上面只插了幾十塊甚至十幾塊磁盤。這其中其他原因暫且不提,你懂的。咱們拋開其他因素,從任何方面講,這都屬于投資浪費。這幾十塊機械硬盤在高端存儲上所能提供的性能,可能只需要幾塊SSD就可以滿足了。至于容量方面,目前很多場景容量都是過剩的,由于機械盤無法提供太高IOPS,不得不用幾十塊甚至上百或者數百上千塊磁盤來堆出所需要的性能,然而磁盤容量的增長速度遠比性能增長速度快,那么數百塊600GB的磁盤,就可以達到上百TB的空間,而這些空間絕大多數可能都被浪費了,只因為單個機械盤性能不夠。機械盤拿數量來換性能,容量過剩。;而SSD則是性能過剩而容量稍小而且價格太高。但是容量和壽命問題可以隨著技術發展不斷得到解決,價格也會不斷降低,而且如果從耗電、占地等個方面綜合判斷,SSD的$/IOPS顯然是劃算的。
2.2.1歷史車輪不可阻擋
外置存儲控制器的前世形態其實是插在服務器里面的Raid卡,后來為何會擴充出去獨立成為“存儲系統”?多種因素,性能和空間問題為主要,另外一種因素是用于多主機共享存儲,后面這個因素目前看來,有點雞肋,到底有多少主機需要與其他主機共享空間?他們只是在“共享同一個設備”,真正需要共享空間的有兩種情況,一種是特殊應用,比如視頻領域、WebServer集群、HPC集群等等,而這些場景畢竟有限;其次則是最近幾年ThinProvision炒作起來之后,確實可以做到全局空間動態分配回收,但是又有多少人真正用到?從這一點上看,這個因素確實是個雞肋,不會阻止底層技術車輪發展導致的上層形態的變革。所以,共享同一個設備,或者共享同一個空間,只是為技術的發展所創造的一個噱頭。而我相信當存儲形態重新輪回回來之后,又會有新噱頭被創造出來。