Opdracht ICT Operations (medior/senior)

Detect to Correct

  • Monitoring batch (Ctrl-M)

Dagelijks waakt een ICT Operator over het goede verloop van +/- 300.000 batch jobs, zowel op OS als op Mainframe. Bij batch is het de bedoeling dat de ICT Operator enkel data issues doorgeeft aan de Software Engineer. Daarom dient een ICT Operator in staat zijn om een dump van een gefaalde job te analyseren zodat hij ingeval van hardware issues de juiste acties onderneemt en niet nodeloos escaleert.

  • Event Monitoring (OMi)

Maandelijks staat ICT Operations ervoor in om +/- 45.000 events te verwerken. Voor elk van deze events is het de bedoeling dat de ICT Operator enkel het nodige rapporteert/escaleert via ServiceNow ICT Incident tooling. Hiervoor dient de ICT Operator steeds een analyse te maken. Events naar aanleiding van interventies dienen zoveel mogelijk gefilterd te worden. Kennis en ervaring zijn hier een must en bieden meerwaarde.

  • Windows Server/ Linux Server / Websphere Application Server herstarten

Deze acties dienen uitgevoerd te worden naar aanleiding van een ICT Event of een ICT Change. Procedure hiervan wordt aangeleverd door de systeemgroep (Windows/Linux/Application servers). Tijdens het uitvoeren van deze procedure wordt er van de ICT Operator verwacht om alle afwijkingen/ bijzonderheden op te merken en door te geven. Naargelang de impact van deze afwijking dient de ICT Operator te beslissen of hij deze verder escaleert of niet. Kennis en ervaring zijn hier een must en bieden meerwaarde.

  • Oplossen van hardware/software/netwerk problemen

Wanneer er problemen opduiken tracht de ICT Operator eerst na te gaan of hij deze zelf kan oplossen. Dit afgaande op aangeleverde procedures, zelf opgestelde procedures, voorgaande incidenten, ervaring. Als doel heeft de ICT Operator steeds om een probleem zelf op te lossen, indien hij hiervoor de middelen of kennis niet heeft zal hij het probleem verder escaleren. Dus, op zich zijn wij niet verantwoordelijk voor processen en systemen. Onze verantwoordelijkheid bestaat er uit dat  afgesproken SLE’s (Service Level Engagement) behaald worden. Dit wil dus zeggen dat een ICT Operator verantwoordelijk is voor het tijdig opgelost raken van een ICT Incident. Wanneer problemen zich situeren over verschillende teams is het ook de taak van de ICT Operator om de rol van moderator en coördinator op te nemen. Indien hij ziet dat SLE’s niet gehaald zullen worden heeft hij verschillende kanalen om problemen te escaleren (Application Manager geïmpacteerde asset, Wacht/senior ICT Operations, Wacht/Ombuds disaster).

 

Change Operations

  • DBOVER (Mainframe databankoverschakeling)

Bij een DBOVER is het zo dat de ICT Operator instaat voor  de voorbereiding en naverwerking van de databankoverschakeling. De procedure hiervoor wordt aangeleverd door de database engineers. Tijdens het uitvoeren van deze procedure wordt er van de ICT Operator verwacht om alle afwijkingen/bijzonderheden op te merken en door te geven.

Naargelang de impact van deze afwijking dient de ICT Operator te beslissen of hij deze verder escaleert of niet. Kennis en ervaring zijn hier een must en bieden meerwaarde.

  • IPL (herstarten van Mainframe systemen)

Voorgeschreven procedure aangeleverd door de systeemgroep. IPL ontwikkeling wordt door de ICT Operator onafhankelijk uitgevoerd. Tijdens het uitvoeren van deze procedure wordt er van de ICT Operator verwacht om alle afwijkingen/bijzonderheden op te merken en door te geven aan de systeemgroep. Naargelang de impact van deze afwijking dient de ICT Operator te beslissen dat het probleem mag blijven liggen tot na het weekend of meteen aangepakt dient te worden. Kennis en ervaring zijn hier een must en bieden meerwaarde. Bij IPL produktie voert de systeemgroep deze ICT Change zelf uit. De meerwaarde van de ICT Operator bestaat hier uit het correleren van de events (OMi messages) die veroorzaakt worden door deze ICT Change. Hij dient afhankelijk van zijn bevindingen hier verder actie op te nemen.

  • Load Balancing

Via ICT Change tooling krijgt een Change ICT Operator de aanvraag om bepaalde cycli in te plannen tijdens de dag/nacht. Bij deze ICT Change geeft de SE een tijdstip mee wanneer de cycli afgelopen moeten zijn. Aan de hand van dit tijdstip gaat de cCange ICT Operator na wanneer deze cyclus het best loopt zodat er geen overmatig CPU verbruik voorvalt. Hogere pieken zorgen voor een meerkost. Hier draagt de change ICT Operator bij aan cost management.

 

Autonomie

Er bestaat geen handboek waarin alle mogelijke scenario’s staan beschreven. Zoals reeds vermeld verwerken

we gemiddeld 45.000 ICT Events per maand . Aan elk van deze ICT Events hangt een basis instructietekst. Door

analyse, ervaring en correlatie bepaalt de ICT Operator welke ICT Events met elkaar verbonden zijn en welke al dan niet gerapporteerd dienen te worden. Hier slagen we er in om 75% van onze events gebundeld aan te leveren aan onze stakeholders, wat hen heel wat tijd en effort bespaard. Deze acties neemt een ICT Operator volledig autonoom aangezien hij deze ombudstaak individueel moet uitvoeren (tijdens de nacht/weekends moet een ICT Operator verschillende ombudstaken op zich nemen).

 

Kennis & Ervaring 

Heel wat acties die een ICT Operator dient uit te voeren staan vooraf beschreven in procedures. In sommige

gevallen is het niet evident om deze procedure uit te voeren zonder enige voorkennis/ervaring. Er zijn SLE’s opgesteld met desbetreffende procedures die gevolgd moeten worden. Uiteraard speelt ervaring een grote rol : hoe meer ervaring, hoe beter hij op situaties zal kunnen anticiperen en interveniëren.

Een ICT Operator kan pas vanaf 4-6 maand zelfstandig weekendwerk uitvoeren. Dit doordat combinatie van de

verschillende ombudstaken zeer arbeidsintensief en onvoorspelbaar in complexiteit is.

Verwachtingen

  1. Heeft basiskennis rond het IT landschap teneinde de mogelijke impact in te kunnen schatten van ICT Events binnen dat IT landschap die haar beschikbaarheid en/of continuïteit in het gedrang brengen
  2. Heeft gedegen kennis van de ondersteunende tooling en van bestaande processen & procedures binnen het IT landschap ter ondersteuning van zijn verantwoordelijkheden
  3. Volgt – conform SLE – ICT Events op en maakt, aan de hand van ontwikkelde expertise, een eerste inschatting van de oorzaak en/of achtergrond van het ICT Event met het oog op een efficiënte, effectieve en snelle opvolging van het risico en/of ICT Incident
  4. Per ICT Event, neemt IT Operator geïnitieerde acties op basis van aangereikte instructies, gemaakte afspraken en/of bestaande gedocumenteerde oplossingen
  5. Conform instructies en/of gedocumenteerde afspraken, registreert ICT Events èn reeds ondernomen (onderzoeks)acties in de daartoe voorziene incident tooling teneinde ombuds – of wachtgroepen en/of andere relevante stakeholders te informeren over de correcte status en voortgang van het ICT Incident
  6. Conform instructies en/of gedocumenteerde afspraken, escaleert ICT Incidenten naar ombuds – of wachtgroepen aan de hand van de daarvoor voorziene incident – /call tooling en overtuigt medewerkers (direct) in actie te gaan, zowel binnen als buiten kantooruren
  7. Volgt actief geregistreerde ICT Incidenten op, fungeert daartoe als aanspreekpunt voor eindgebruikers/stakeholders en bewaakt de Incident SLE bij afhandeling van het ICT Incident (= incident manager rol)
  8. Monitort proactief de workload automation omgeving (batch) en neemt actie(s) teneinde de dagelijkse planning tijdig en efficiënt af te werken (zie detailinfo)
  9. Voert op aanvraag en conform gedocumenteerde instructies specifiek toegewezen service requests uit in het kader van IT-Infrastructuur en workload automation (= service executant rol)
  10. Voert, binnen het aangegeven “change venster”, conform gedocumenteerde instructies & procedures en met de nodige verantwoordelijkheid, ICT Changes uit in het kader van Move to Production ( = ICT Change executant rol).

 

Verantwoordelijkheden

  1. Ik ben verantwoordelijk voor het ontwikkelen en onderhouden van mijn kennis rond het IT landschap, de processen, de procedures en de ondersteunende service tooling
  2. Ik ben verantwoordelijk voor het tijdig en efficiënt opvolgen van ICT Events teneinde de te nemen actie(s) te identificeren
  3. Ik ben verantwoordelijk voor het ontwikkelen en aanwenden van mijn expertise om de oorzaak, achtergrond en/of mogelijke impact van het ICT Event in te kunnen schatten teneinde de efficiënte, effectieve en snelle opvolging van het risico en/of ICT Incident te faciliteren
  4. Ik ben verantwoordelijk voor het tijdig en conform instructies nemen van IT Operator geïnitieerde acties teneinde het ICT Event zelf op te nemen (bypass) of te escaleren naar ombuds – of wachtgroepen
  5. Ik ben verantwoordelijk voor het tijdig en kwalitatief registreren van ICT Events en alle ondernomen acties zodat ik ombuds-, wachtgroepen en andere relevante stakeholders correct en blijvend kan informeren over de status en voortgang van het ICT Incident
  6. Ik ben verantwoordelijk voor het tijdig en correct escaleren van ICT Incidenten naar ombuds- of wachtgroepen teneinde de juiste experten zo snel mogelijk in actie te laten gaan
  7. Ik ben verantwoordelijk voor het actief opvolgen van ICT Incidenten teneinde de Incident SLEs te bewaken
  8. Bij het doorbreken van Incident SLEs : ik ben verantwoordelijk voor het escaleren van ICT Incidenten naar Major ICT Incident Coördinatie teneinde potentiële ICT Disasters in te leiden
  9. Ik ben verantwoordelijk voor de tijdige en volledige uitvoering van de planning binnen onze workload automation omgeving teneinde de continue voortgang van onze geautomatiseerde batchprocessen te garanderen
  10. Ik ben verantwoordelijk voor het tijdig en conform procedures uitvoeren van service requests teneinde eindgebruikers de gevraagde ICT Services op een kwalitatieve manier te verlenen
  11. Ik ben verantwoordelijk voor het tijdig en conform instructies/procedures uitvoeren van ICT Changes teneinde ICT Changes op een verantwoorde manier in ons IT landschap te zetten

 

Werkregime 

  • Volcontinu ploegenstelsel

Voormiddag                            Namiddag                                Nacht

maandag          6u15 – 14u00                            13u50 – 21u30                          21u15 – 06u45

dinsdag            6u15 – 14u00                            13u50 – 21u30                          21u15 – 06u45

woensdag         6u15 – 14u00                            13u50 – 21u30                          21u15 – 06u45

donderdag        6u15 – 14u00                            13u50 – 21u30                          21u15 – 06u45

vrijdag              6u15 – 13u45                           13u40 – 21u30                          21u15 – 06u45

zaterdag           6u15 – 14u00                            13u50 – 21u30                          21u15 – 06u45

zondag             6u15 – 14u00 (UR)                    13u50 – 21u30 (UR)                  21u15 – 06u45

  • Nachtshiften

(1)  MA – DO

  • DO – VR
  • VR – MA

Indien de ICT operator nachtshift (3) heeft gewerkt, zal hij de 4 daarop volgende werkdagen niet worden ingepland.

 

Praktische informatie

  • Niveau: medior tot senior: Ervaring in gelijkaardige functies is min of meer “verwacht”. Onze verwachting is dat de consultant na 3 maand zelfstandig de ombudstaken kan opnemen en nog minimale begeleiding nodig heeft.
  • Talenkennis: NL, FR en ENG
  • Ervaring in technologie: goede noties Mainframe, Netwerk, Windows SV/Linux SV/WAS, ServiceNow, Control-M, Event Monitoring (gewenst)
  • Dagtarief gebaseerd op 36u/week (gemiddeld 7.2u/dag)