Themapatroon bedrijfscontinuïteit

Uit NORA Online
Naar navigatie springen Naar zoeken springen


Onderdeel van
Thema's
Contact
Guus van den Berg
Guus.vandenberg@cip-overheid.nl
Status
Dit thema wordt momenteel opnieuw bekeken door de Expertgroep Beveiliging

Leeswijzer

Dit themapatroon beschrijft een oplossing voor de algemene probleemstelling van bedrijfscontinuïteit; ook wel genoemd: Business Continuity Management (BCM). Het patroon legt de focus op IT-voorzieningen.

Criteria

Beschikbaarheid is het belangrijkste criterium voor bedrijfscontinuïteit.

Context

Onder druk van de markt, beïnvloed door Internet services en e-Commerce voor just-in-time processen, ervaren organisaties een toenemend belang van processen en voorzieningen voor bedrijfscontinuïteit.

Uitval van een rekencentrum als gevolg van een crisis

De figuur schetst de gevolgen voor de klant van het uitvallen van een deel van een rekencentrum als gevolg van een crisis. Lang niet elk incident zal binnen de normale bedrijfsvoering kunnen leiden tot grootschalige uitval van IT-voorzieningen. Het reguliere incidentmanagementproces zorgt er in meer dan 99,9% van de gevallen voor dat de normale bedrijfsvoering binnen de SLA afgesproken tijd wordt hersteld.

De SLA (Service Level Agreement) definieert de beschikbaarheid binnen regulier incidentmanagement.

De RTO (Recovery Time Objective) is de door de business vastgestelde maximale tijd waarbinnen het voor de bedrijfsvoering cruciale, minimum serviceniveau moet zijn hersteld.

De MTPD (Maximum Tolerable Period of Disruption) is de door business vastgestelde maximale tijd dat een crisis mag duren inclusief de incident (aandachts-)fase.

Fasering van een incident dat leidt tot een crisis

Definitie

Een crisis is een toestand na een onverwachte gebeurtenis, met dermate negatieve gevolgen, dat de reguliere probleemoplossende activiteiten onvoldoende zijn voor het herstel van de normale situatie, waarbij de continuïteit van de bedrijfsvoering in gevaar is.

Probleem

Wanneer incidenten leiden tot grootschalige verstoringen van de bedrijfsprocessen, of zelfs tot een totale vernietiging van bedrijfsmiddelen (waaronder IT-voorzieningen), dan ontbreken op het moment van voorval de mogelijkheden om adequate maatregelen te treffen, wanneer deze niet vooraf zijn bedacht en voorbereid.

Oplossing

stap 1

Een crisisteam neemt in geval van een crisis (wanneer de SNO/SLA garanties niet meer gelden) de centrale besturing van de organisatie (of bedrijfsonderdeel) over en beperkt zich tot crisismanagement processen. Crisismanagement begint in de figuur bij een vooraf gedefinieerde ‘drempel’ die bepaald wordt door de ernst of de duur van een incident. In de nazorgfase zorgt het crisisteam voor de terugkeer tot de normale bedrijfsvoering.

stap 2

Het lijnmanagement geeft opdracht tot het opstellen en het regelmatig testen van een Continuïteitsplan (CP), dat beschrijft welke IT-systemen cruciaal zijn voor het voortbestaan van de organisatie (-onderdeel). Het management geeft tevens opdracht tot het ontwikkelen van een visie en uitwerking daarvan op redundantie van IT-voorzieningen, resp. van Hot of Cold standby. Behalve voor IT-voorzieningen beschrijft het CP de fasering, de noodwerkwijze en alle benodigde maatregelen voor personeel, organisatie, huisvesting en logistiek om de organisatie tijdens een crisis te kunnen laten ‘overleven’. De noodwerkwijze is een alternatieve werkwijze, die de bedrijfsvoering op een minimaal acceptabel (service)niveau gaande houdt. Reconstructie is het herstel van data (ook niet digitale), huisvesting etc. Een CP omvat samengevat de aanvalsstrategie voor een crisis.

stap 3

Vanuit het CP worden Disaster Recovery Plannen (DRP) opgesteld, die van de cruciale IT-systemen in volgorde aangeven welke applicaties het eerst moeten worden hersteld op basis van welke infrastructuur, al dan niet gelegen op een uitwijklocatie. De CP en de DRP’s worden periodiek getest op de beoogde werking.

DRP als IT-onderdeel van een continuïteitsplan

Gerelateerde patronen