機房(fáng)建設中供電系統存在的問題相關推薦:機房(fáng)建設中PDU的選擇、機房(fáng)建設中UPS蓄電池監控、機房(fáng)建設中UPS的維護和保養、計(jì)算(suàn)機機房(fáng)供配電方式
在數(shù)據中心中,供電系統是基礎設施最重要子系統之一,而長期以來(lái),業界對供電系統的認識一直停留在電力電子技(jì)術(shù)層面,很(hěn)少(shǎo)有(yǒu)權威的專業機構認真地研究用戶在使用過程中存在的系統規劃設計(jì)和方案配置的問題。傳統供電系統中存在的問題更多(duō)的表現在系統規劃設計(jì)、供電方案的選擇、設備的正确使用等系統工程方面。
特别是很(hěn)多(duō)錯誤的觀念和設備廠商的誤導,使這些(xiē)問題更加嚴重和難以解決。歸納起來(lái)有(yǒu)以下六個(gè)方面的問題:
一、過度規劃和生(shēng)命周期成本問題
1、過度規劃和設備利用率低(dī)下。采用“一次到位”的方式,最初裝機運行(xíng)時(shí),設備的實際負載量僅為(wèi)9%左右,第5年時(shí)預計(jì)負載量增加到設計(jì)容量的80%左右,而供電設備的實際負載量隻達到設計(jì)容量的30%左右。
2、空(kōng)間(jiān)或占地面積的問題。電力設施包括發電機組、UPS系統、電池系統、輸入開(kāi)關櫃和輸出配電櫃等。随着IT設備的小(xiǎo)型化,人(rén)們發現IT設備所占空(kōng)間(jiān)與基礎設備所占空(kōng)間(jiān)的比例有(yǒu)越來(lái)越小(xiǎo)的趨勢,這使得(de)用戶的心裏感到不平衡。能否壓縮整個(gè)整個(gè)供電系統所占用的空(kōng)間(jiān)呢?
3、裝配速度問題。設備采購存在着交貨周期的題,方案設計(jì)和系統安裝都需要時(shí)間(jiān)。用戶必須提前6個(gè)月購買這些(xiē)系統和設備,通(tōng)常情況下,數(shù)據中心的實際建設時(shí)間(jiān)一般要3~18個(gè)月不等。用戶希望能夠縮短(duǎn)從做出決定進行(xíng)修建到實際建成并投入運行(xíng)的時(shí)間(jiān)。
4、能源效率問題。對于傳統的未刻意做節能設計(jì)的數(shù)據中心,整個(gè)供電系統的能耗占數(shù)據中心總能耗的21%,在能耗指标PUE(假定等于2.8)中占的比例是0.45左右,所以供電系統的效率在75%左右。
5、服務合同的費用問題。由于大(dà)型UPS系統的複雜性,加上(shàng)缺乏技(jì)術(shù)娴熟、經驗豐富并經過高(gāo)級培訓的技(jì)術(shù)人(rén)員,導緻了服務合同費用的居高(gāo)不下,更令用戶感到不平的是,服務費用都是按照UPS的裝機容量來(lái)報價的,盡管用戶實際隻用到了UPS 70%以下甚至隻有(yǒu)10%的容量。用戶希望能夠找到降低(dī)複雜性的途徑,以此來(lái)簡化所服務并降低(dī)服務合同的費用。
二、供電系統的适應性及可(kě)擴展性
1、系統和部件的标準化與規範化。目前大(dà)型UPS系統變得(de)越來(lái)越複雜,導緻現場(chǎng)工程設計(jì)工作和設計(jì)方案的多(duō)樣性,增加了用戶或技(jì)術(shù)顧問公司、設計(jì)院的負擔,顧問工程師(shī)會(huì)因設計(jì)的複雜性和資源配置問題而承擔極大(dà)的風險。用戶希望有(yǒu)一種方案能夠使得(de)所有(yǒu)部件标準化、規範化,這不僅可(kě)降低(dī)設計(jì)和施工的工作量,還(hái)可(kě)以降低(dī)設計(jì)和組建的風險。
2、不可(kě)預測的功率密度問題。用電設備的功率密度不斷增大(dà)和配置不均衡為(wèi)設備的配電提出了挑戰。一個(gè)機櫃如果安裝早期的服務器(qì),隻能容納10台(10個(gè)電源插座),現在,一個(gè)機櫃能容納40個(gè)1U的服務器(qì)(40個(gè)電源插座),将來(lái)這個(gè)數(shù)目還(hái)可(kě)能增加。用戶提出這樣的疑慮:電力基礎設施能否适應這種不斷變化而又無法預測的功率密度帶來(lái)的影(yǐng)響呢?
3、如何适應不斷變化的其他需求。機櫃內(nèi)的設備升級更換時(shí)會(huì)導緻許多(duō)其他問題,諸如新舊(jiù)設備的重量密度不同、安裝要求不同、單電源設備與雙電源設備對配電要求不同、交流設備與直流設備對配電要求也不同等。除此之外,UPS容量的擴展也面臨以下3個(gè)問題:新舊(jiù)UPS系統的兼容問題;新擴容的UPS與現場(chǎng)環境的匹配問題;擴容升級過程中會(huì)不會(huì)被迫中斷現有(yǒu)業務。用戶非常希望有(yǒu)一種不停電擴容的解決方案。
三、供電系統可(kě)用性的問題
1、斷路器(qì)數(shù)量增加以及指标離散性問題。供電系統和關鍵負載之間(jiān)配置了許多(duō)斷路器(qì),每個(gè)斷路器(qì)都是一個(gè)單路徑故障點。另外,相同指标而不同廠商的斷路器(qì),其運行(xíng)過程中的實際動作穩定值也存在着很(hěn)大(dà)差異,這在很(hěn)大(dà)程度上(shàng)影(yǐng)響了供電系統線路保護機制(zhì)。情況最糟糕時(shí),下遊斷路器(qì)可(kě)能不會(huì)動作,而最終導緻上(shàng)遊的斷路器(qì)動作,結果發生(shēng)大(dà)面積負載掉電的情況。用戶希望能夠減少(shǎo)斷路器(qì)的數(shù)目以及使用更加标準化的斷路器(qì)。
2、操作人(rén)員人(rén)為(wèi)操作失誤的問題。造成關鍵負載宕機的大(dà)部分原因是由于供電系統複雜性極高(gāo)而又缺乏處理(lǐ)這類複雜系統的專業技(jì)術(shù)人(rén)員等原因造成的。除此之外,針對如此複雜的系統,對人(rén)員進行(xíng)的培訓也遠遠沒有(yǒu)達到所需要的水(shuǐ)平。用戶非常希望得(de)到一種能夠很(hěn)容易地減少(shǎo)人(rén)為(wèi)因素的解決方案。
3、把供電與負載之間(jiān)的故障點減至最少(shǎo)。過去,用戶通(tōng)常在交流輸入和UPS環節引入冗餘設備,但(dàn)是他們往往忽略終端配電一級的單路徑故障點,例如他們在UPS和關鍵負載之間(jiān)設置多(duō)個(gè)斷路器(qì),而且UPS和關鍵負載之間(jiān)的距離很(hěn)長,有(yǒu)的UPS放置于地下室而負載放置于5樓的情況,所以希望冗餘設施距離負載能夠更近一些(xiē),并且減少(shǎo)UPS和關鍵負載之間(jiān)的斷路器(qì)數(shù)量。
4、減少(shǎo)大(dà)面積斷電的故障點。一旦宕機發生(shēng),我們希望故障的影(yǐng)響盡量局限在小(xiǎo)面積的用電設備。用戶在設計(jì)整個(gè)供電系統時(shí)往往會(huì)在集中式供電或分布式供電這兩種方案中猶豫不決:集中式供電有(yǒu)許多(duō)優點,但(dàn)是它的緻命缺陷是一旦供電系統發生(shēng)故障,所有(yǒu)設備均會(huì)因停電而宕機;分布式供電能夠解決大(dà)面積業務中斷的危險,但(dàn)是存在着不易管理(lǐ)等缺點,用戶希望能夠消除并控制(zhì)自己電源系統的故障。
5、供電系統的諧波幹擾問題。高(gāo)次諧波不僅會(huì)降低(dī)設備輸入功率因數(shù),直接污染電網,無功電流的存在還(hái)會(huì)增加電網容量和系統配置容量,增大(dà)能源損耗和運行(xíng)成本,而附加的濾波器(qì),不僅重量、體(tǐ)積和成本都顯著增大(dà),而且還(hái)存在着電路發生(shēng)振蕩的可(kě)能。用戶希望能夠減少(shǎo)供電設備産生(shēng)的諧波幹擾。
6、用戶與廠商之間(jiān)信息共享問題。由于設備安裝的複雜性,故障發生(shēng)時(shí)對故障根源的分析變得(de)非常困難。用戶指出,基礎設施部件中存在着太多(duō)的變化,希望能夠通(tōng)過統一标準的系統收集數(shù)據和比較結果,并且規範校(xiào)正和處理(lǐ)的措施。他們希望同一機構內(nèi)不同場(chǎng)地的機房(fáng)能夠使用同樣設備,從而管理(lǐ)人(rén)員能夠相互分享管理(lǐ)經驗及故障處理(lǐ)經驗。
四、設備選用和安裝使用問題
1、采購設備時(shí)存在着錯誤的觀念和誤導。例如确定選用UPS的性能标準時(shí),不是從UPS的輸出電性能指标、輸出能力和可(kě)靠性指标、對電網的适應能力、系統配置能力、智能管理(lǐ)和通(tōng)訊功能、可(kě)維護性和可(kě)擴充性等方面對其進行(xíng)全面的考察,而是受廠家(jiā)的誤導,把廠家(jiā)宣傳的産品能達到的某些(xiē)最高(gāo)性能指标做為(wèi)自己選用的标準;簡單地以UPS電路結構形式定優劣。
2、系統設計(jì)缺欠造成潛在的質量問題。很(hěn)多(duō)已經在運行(xíng)的供電系統在設計(jì)上(shàng)不規範,系統配置不盡合理(lǐ),存在着諸多(duō)隐患。諸如:所有(yǒu)設備都是串連的,形成單路徑故障點;各相接的設備輸入輸出阻抗不匹配;因配置了輸入諧波電流大(dà)和啓動沖擊電流大(dà)的設備,不僅污染電網,而首先是在系統內(nèi)部形成嚴重的相互幹擾;電力傳輸線過長和布局零亂而易産生(shēng)幹擾和發生(shēng)人(rén)為(wèi)事故;配置了大(dà)量的斷路器(qì),由于産品質量問題,或者在容量和動作時(shí)間(jiān)方面配置得(de)不合理(lǐ),使系統有(yǒu)時(shí)發生(shēng)不明(míng)的故障;系統零、地線系統設計(jì)和線纜選用不符合标準等。
3、缺乏可(kě)量化的可(kě)靠性衡量指标。安全性和可(kě)靠性是當前供電系統最主要的問題。但(dàn)是在選用設備時(shí),卻沒有(yǒu)可(kě)量化的可(kě)靠性指标作為(wèi)選用的依據。UPS設備廠家(jiā)提供的可(kě)靠性指标是平均無故障時(shí)間(jiān)MTBF,是一個(gè)概率指标,在采購設備時(shí)這項指标是不可(kě)測量驗證的,因而最終是不可(kě)信的。一種常見的現象是,用戶刻意選用的高(gāo)可(kě)靠的設備,而實際運行(xíng)後卻故障頻繁。用戶希望有(yǒu)一種可(kě)信的可(kě)量化的可(kě)靠性指标。
五、UPS對供電系統的可(kě)管理(lǐ)性問題
1、UPS輸出的分路管理(lǐ)問題。用戶對分支電路的超載問題比較關心,分支線路過載時(shí),斷路器(qì)就會(huì)動作,該支路內(nèi)連接的機櫃的所有(yǒu)設備就會(huì)宕機。在極端情況下,會(huì)發生(shēng)保護該過載電路的斷路器(qì)不動作而引起上(shàng)遊斷路器(qì)動作,這将使更多(duō)的機櫃或更大(dà)面積的設備發生(shēng)宕機。用戶非常希望能夠獲得(de)可(kě)管理(lǐ)的輸出,以便在上(shàng)述故障發生(shēng)之前可(kě)以得(de)到報警。有(yǒu)些(xiē)用戶甚至提出希望在機架PDU上(shàng)能夠監控配電插座上(shàng)每一個(gè)插孔的情況。
2、監控負載機櫃的電源狀态。用戶希望有(yǒu)一些(xiē)安裝在本地的顯示裝置以提醒維護操作人(rén)員可(kě)能發生(shēng)的故障。目前要弄清楚每個(gè)機櫃上(shàng)的電源狀況是很(hěn)困難的,但(dàn)在有(yǒu)些(xiē)情況下,即使能夠查看每個(gè)機櫃上(shàng)的電流,也是需要通(tōng)過遠程管理(lǐ)界面來(lái)查看。用戶希望能夠在巡查過程中看到每一個(gè)機櫃的各個(gè)輸出插座的電流情況。
3、線纜管理(lǐ)的問題。随着業務的發展,IT設備被不斷地追加安裝,機櫃上(shàng)的功率密度不斷增加,這就必須把更多(duō)的電纜連接到配電櫃上(shàng)。如果機櫃使用2N設計(jì),機櫃就需要有(yǒu)AB兩路供電電纜。如果再考慮到高(gāo)密度服務器(qì)數(shù)量有(yǒu)進一步增加的趨勢,在極端情況下,一個(gè)機架上(shàng)甚至可(kě)以安裝200多(duō)個(gè)刀片式服務器(qì)。這樣就使數(shù)據中心的電纜數(shù)目大(dà)大(dà)增加,成為(wèi)管理(lǐ)和宕機風險方面令管理(lǐ)人(rén)員頭痛的問題。如何改變電纜的混亂狀況,改善電纜的管理(lǐ)水(shuǐ)平呢?
4、預防性故障分析的問題。用戶一直依賴勞動力密集的預防性維護操作、紅外線探測等作為(wèi)他們檢查核實潛在問題的方法,而這些(xiē)乏味的重複性工作又往往需要受過專業訓練、經驗豐富的工程師(shī)完成。用戶希望電源系統應該具備足夠的智能水(shuǐ)平以及自我診斷能力,以便能夠在故障實際發生(shēng)之前發現并通(tōng)知這些(xiē)潛在故障。
六、可(kě)服務性的問題
1、減少(shǎo)平均維修時(shí)間(jiān)MTTR的問題。系統的易管理(lǐ)性是減少(shǎo)平均維修時(shí)間(jiān)的前提,但(dàn)是故障判斷後,部件的更換往往是減小(xiǎo)平均維修時(shí)間(jiān)的關鍵。許多(duō)供應商提供了并在多(duō)數(shù)情況下能夠完成響應時(shí)間(jiān)的承諾,但(dàn)問題是趕到現場(chǎng)是一回事,是否攜帶了合适的備件又是另一回事。如果用戶自身在裝機時(shí)同時(shí)購買常用部件,這種情況會(huì)有(yǒu)所改善,但(dàn)用戶端的儲存條件又不能保證備件的“完好性”,另外,自備配件也會(huì)占據用戶寶貴的空(kōng)間(jiān)。總之,用戶希望能更準确地解決故障并盡可(kě)能地縮短(duǎn)修複時(shí)間(jiān)。
2、降低(dī)系統的複雜性問題。目前的電力設施是非常複雜的,準确迅速地判斷故障是非常困難的事情。系統的複雜性會(huì)帶來(lái)兩方面的影(yǐng)響,第一,系統越複雜,操作人(rén)員和管理(lǐ)人(rén)員産生(shēng)人(rén)為(wèi)失誤的可(kě)能性就越大(dà);第二,系統越複雜,系統發生(shēng)故障時(shí)對故障進行(xíng)定位診斷所需要的時(shí)間(jiān)越長。用戶非常希望能夠降低(dī)系統的複雜程度以及提高(gāo)操作的容易程度。
3、提高(gāo)使用維護水(shuǐ)平。供電設備已經具備的智能管理(lǐ)和通(tōng)訊管理(lǐ)功能沒有(yǒu)得(de)到充分的發揮。權威人(rén)士估計(jì)對UPS的智能管理(lǐ)和通(tōng)訊功能的應用率大(dà)概隻有(yǒu)30%。在UPS供電系統各類故障的起因中,人(rén)為(wèi)原因造成的故障占很(hěn)大(dà)的比例,人(rén)為(wèi)故障的原因可(kě)歸結為(wèi)維護人(rén)員對所配置的UPS的基本性能了解不夠、對UPS監測監控信息和顯示功能不熟悉、對UPS運行(xíng)時(shí)的常規維護要求不清楚且對維護規章制(zhì)度執行(xíng)不嚴格等。
6、供應商之間(jiān)的相互推诿的問題。由于系統的複雜性,設計(jì)者和用戶要與越來(lái)越多(duō)的設備廠商打交道(dào),各廠商的設備之間(jiān)的匹配以及各廠商的工程師(shī)之間(jiān)的配合變得(de)越來(lái)越複雜了。當系統中的某一個(gè)環節出現問題時(shí),各廠商的工程師(shī)往往從自身利益角度出發,而不是從整個(gè)系統的角度出發來(lái)判斷、認定和解決問題。他們往往會(huì)自覺或不自覺地推卸責任。争論的焦點往往會(huì)從發現問題、提出解決問題的方案本身到發現其他設備的缺陷上(shàng)面去,甚至有(yǒu)的用戶抱怨說,在這種情況下他們已經從一方職員變成為(wèi)一個(gè)必須善于斡旋的“政治家(jiā)”。用戶非常希望能得(de)到一種解決方案,它能減少(shǎo)或消除供應商之間(jiān)的相互推诿。
業務範圍:成都市、自貢市、攀枝花(huā)市、泸州市、德陽市、綿陽市、廣元市、遂甯市、內(nèi)江市、樂山(shān)市、南充市、眉山(shān)市、宜賓市、廣安市、達州市、雅安市、巴中市、資陽市、阿壩藏族羌族自治州、甘孜藏族自治州、涼山(shān)彜族自治州