Get Adobe Flash player

Az áramellátási biztonság (Egy géptermi leállás margójára)

2012 – 05-20
Egy távközlési vagy IT szolgáltatás részleges vagy teljes kiesése egy áramellátási munka során vétett hiba miatt jó esetben csak presztízs veszteséget okoz, de akár súlyos anyagi vonzata is lehet. Kívánatos, ha a kezdeti  indulatokon felül kerekedik a higgadt elemzés (Root cause, RPR  stb.), de ennél sokkal jobb, ha előzetesen történik meg a munka részletes elemzése, tervezése.

A total or partial breakdown of a telecommunication or IT service due to an error made during a power supply work being done can cause beside loss of prestige a serious financial loss. It is good if the objective analysis (Root cause, RPR, etc) succeed over the principal emotions, but it is even better if the detailed analysis and planning of the work occurs in advance.

Egyre gyakoribb az elvárás, hogy élesben üzemelő távközlési vagy IT rendszer áramellátásán kell munkákat végezni. Sajnos gyakran nem tudatosul, hogy minden „éles rendszeren” végzett tevékenység hordoz rizikót, hiba lehetőséget, ami az áramellátás kiesését okozhatja és ez miatt a fogyasztói rendszer és a szolgáltatás leállhat.

Éppen ezért mindig megéri előzetesen egy higgadt aprólékos elemzéssel az összes körülményt és összefüggést
számításba venni, a tevékenységet aprólékosan megtervezni, hogy elkerülhessük a hibákat (utólagosan pedig – ha mégis megtörtént a baj – az elemzés segíthet a jövőbeli újabb hasonló eseteket elkerülni).

Kezdjük azzal, hogy megvizsgáljuk a meglévő áramellátási koncepciót. Redundanciák, alternatív ellátási útvonalak, elosztórendszer rugalmassága, és szelektivitása illeszkedik-e a fogyasztói követelményekhez. A koncepció szinte egyértelműen meghatározza, milyen éles üzem közbeni munkákat szabad, illetve lehet elvégezni.   Egyszerű áramellátási struktúra esetén rendszer leállítás javasolt a biztonság érdekében. Ha még is az éles üzemi munka mellett „kell” dönteni, akkor egy minden részletre kiterjedő aprólékos technológiai tervezést kell végrehajtani.

Kétsínes, redundáns struktúra esetén jobb a helyzet, egyes műveletek élő rendszer mellett is elvégezhetők „rizikó mentesen”. A „rizikó mentesen” kifejezés azért van idéző jelbe téve, mert több oldalról leselkedhet veszély még ilyen esetben is. Ezért ekkor is szükséges a tervezett munkavégzés technológiai elemzése és a meglévő rendszer alapos áttekintése, annak érdekében, hogy egy esetleges hiba hatásait felismerjük, minimalizáljuk.

Fontos, hogy a tervezett munka-technológia közös – minden érdekelt illetve érintett szakember általi – elemzése megtörténjen. A több oldalról történő áttekintés segít felderíteni az esetleges kényes lépéseket, és annak szükség szerinti változtatásával biztonságosabb munkamenet alakítható ki.

Alaposan át kell tekinteni a meglévő rendszert is azzal a céllal, hogy összevessük a tervezett lépéseket a valósággal, hogy a kivitelezhetőséget ellenőrizzük, illetve megvizsgáljuk, hogy az egyes technológiai lépésekhez a feltételezett körülmények valóban adottak-e. Előfordul például, hogy egy redundáns kétsínes rendszerben az idők folyamán akár kritikus fogyasztók is csak az egyik sínre kerülnek bekötésre és így maradnak elfeledve. Ilyenkor egy előzetes ellenőrzés hiánya végzetes leállást okozhat az adott sínszakasz lekapcsolásakor vagy kiesésekor. Csak a megfelelően megtervezett, kölcsönösen elfogadott és kivitelezhetőség oldaláról ellenőrzött munkamenet birtokában kezdhető meg a kivitelezés.

Mindezekre azért van szükség, mert az emberi tényezőben rejlő bizonytalanságot sajnos nem tudjuk kizárni, de a minimalizálására törekednünk kell.  Emberek hajtják végre a tervezett munkát, egy esetleges emberi hiba lehetősége mindig ott lappang. Egy jól végig gondolt munkamenet és a rendszerek oldaláról tartalékolt háttér biztosítani tudja, hogy egy esetleges emberi mulasztás ne okozzon „végzetes” következményeket. Ennek fényében nagyon fontos a technológiai fegyelem betartása, és hogy körültekintően válasszuk ki a folyamat résztvevőit is.

Ellenőrizzük, rögzítve lettek-e pontosan, menetrend szerűen a folyamatok, hogy kinek mi a dolga, ki milyen beavatkozásokat végezhet és mikor, milyen sorrendben és persze a végrehajtás során ellenőrizzük a fentiek betartását. Fontos a folyamat résztvevőinek körültekintő kiválasztása is, adott-e a felkészültség, a bizonyított tapasztalat, ne csak az olcsó ár legyen a szempont.

Nem utolsó sorban a tervezett munkára szánt időt is érdemes elemezni. Kellő idő áll-e rendelkezésre? Nem nehezedik-e túl nagy nyomás a kivitelezőkre? Adott esetben ezek komoly mértékben járulhatnak hozzá egy nem kívánt esemény bekövetkezéséhez.

Ha jól végeztük a dolgunkat, akkor biztosítottuk, hogy legalább több körülmény együttes megléte kelljen egy súlyos kimenetelű leállás, illetve szolgáltatás kiesés bekövetkezéséhez. De ne álljunk meg itt, igen is érdemes elemeznünk a többszörös a lehetőségeket is.

Példaként említek egy konkrét esetet, amelyben a kétsínes áramellátás bővítése során a kivitelező által felcserélt két tápkábel közrejátszott abban, hogy súlyos szolgáltatás leállás következett be. A belső vizsgálat kimutatta, hogy a kivitelező hibáján túl, a többi kivitelező oldaláról nem volt betartva a technológiai fegyelem, ellenőrzés nélkül került üzembevételre egy új elosztó.

Továbbá előzetesen nem lett felmérve illetve ellenőrizve a tény állapot, hogy a távközlési eszközök ténylegesen kettős ellátást kapnak-e. Így tehát legalább a fenti három hiba együttes megléte kellett ahhoz, hogy a szolgáltatás leállása bekövetkezzék.

A fenti hibákon kívül az oly gyakran jellemző szűkös időtényező, stresszes munkakörnyezet is egyértelműen hatással volt a kialakult végkifejletre. Sok egyéb tanulsággal is szolgált az eset, és csak bízni lehet abban, hogy a résztvevők többsége okult belőle.

Nem kellene, hogy egy súlyos IT vagy távközlési rendszer leállás világítson rá arra, hogy az áramellátás, az áramellátási munkák komoly tervezést és odafigyelést igényelnek. Törekedjünk arra, hogy ne legyenek felületesen kialakított koncepciók, amelyekben a részletek elhanyagolásra kerültek, továbbá hogy a meglévő rendszerekben az idők folyamán elkövetett kisebb nagyobb hibák kijavításra kerüljenek, és hogy legyenek alapos munka-technológiák.