Instrument

SLA-Management für Rechenzentrums-Dienstleister

Service Level Agreements (SLAs) bilden das Fundament der Beziehung zwischen Rechenzentrumsbetreiber und Kunde. Für FM-Fachleute ist SLA-Management tägliche Arbeit: messen, berichten und verbessern. Ein gut verwaltetes SLA schützt beide Parteien und verhindert Diskussionen bei Vorfällen.

Deutsche Rahmenbedingungen

In Deutschland werden SLAs typischerweise in Anlehnung an DIN EN 15221 (Facility Management) und branchenspezifische Leitlinien des eco-Verbands gestaltet. Deutsches Vertragsrecht (BGB §§ 535 ff. und §§ 631 ff.) gilt für die vertraglichen Verpflichtungen. Streitigkeiten werden häufig über die Deutsche Institution für Schiedsgerichtsbarkeit (DIS) oder über ordentliche Gerichte gelöst. Das IT-Sicherheitsgesetz 2.0 stellt für KRITIS-Betreiber zusätzliche Anforderungen an Verfügbarkeit und Meldepflichten.

Schlüsselbegriffe

SLA (Service Level Agreement)
Messbare Vereinbarungen über Dienstleistungsqualität, einschließlich Verfügbarkeitsgarantien, Reaktionszeiten, Wartungsverfahren und Kompensationsregelungen.
KPI (Key Performance Indicator)
Messbarer Leistungsindikator, anhand dessen die Dienstleistung bewertet wird. Beispiele: Verfügbarkeits-Prozentsatz, mittlere Wiederherstellungszeit, PUE.
Service Credits
Finanzielle Entschädigung (Rechnungsrabatt), die der Betreiber schuldet, wenn SLA-Ziele nicht erreicht werden. Wird als Prozentsatz der monatlichen Vergütung berechnet.
Eskalationsmatrix
Schema, das beschreibt, wer wann bei Vorfällen informiert und einbezogen wird, geordnet nach Schweregrad und Dauer.
Vorfallsbericht
Strukturierter Bericht einer Störung: Zeitablauf, Ursache, Auswirkung, ergriffene Maßnahmen und präventive Aktionen. Wird betroffenen Kunden mitgeteilt.

Anwendung in der Praxis

Beginnen Sie mit der Definition messbarer KPIs, die den Bedürfnissen des Kunden entsprechen. Verfügbarkeit ist der bekannteste KPI, aber nicht der einzige. Ergänzen Sie ihn um Reaktionszeiten (Wie schnell reagiert das Team auf eine Meldung?), Wiederherstellungszeiten (Wie schnell wird eine Störung behoben?) und Umgebungsparameter (Temperatur, Luftfeuchtigkeit innerhalb der Spezifikation).

Implementieren Sie automatisiertes Monitoring und Berichterstattung. Nutzen Sie DCIM-Software, um KPIs in Echtzeit zu messen und monatliche Berichte zu generieren. Manuelle Berichterstattung ist fehleranfällig und zeitaufwendig. Stellen Sie Kunden Dashboards bereit, damit diese ihre SLA-Leistung selbst einsehen können.

Führen Sie monatliche oder vierteljährliche Service Reviews mit Kunden durch. Besprechen Sie die KPI-Ergebnisse, eventuelle Vorfälle und geplante Arbeiten. Nutzen Sie Vorfallsberichte als Lernmomente: Was ging schief, wie wurde es gelöst, und was wird getan, um eine Wiederholung zu verhindern? Eine proaktive Haltung im SLA-Management schafft Vertrauen und senkt das Eskalationsrisiko.

Verwandte Themen