Checkliste für den Grundpfeiler "Zuverlässigkeit"

Best Practices für die Zuverlässigkeit

Kennung	Best Practice
R.1	Streben Sie eine vernünftige Strategie bezüglich der Zuverlässigkeit an – mehr ist nicht immer besser. Die Konfiguration eines internen Systems für hohe Verfügbarkeit mag nach einer guten Idee klingen, aber wenn der betriebliche Aufwand für die Wartung einer größeren Infrastruktur von den eigentlichen Zielen der Organisation ablenkt, ist die gesteigerte Zuverlässigkeit mit zu hohen Kosten verbunden. Legen Sie mit den Beteiligten sorgfältig die Erwartungen an die Wiederherstellungszeit fest.
R.2	Führen Sie regelmäßige Systemsicherungen mit unterstützten Werkzeugen durch, und erstellen Sie einen Plan, um die Wiederherstellung von Sicherungen regelmäßig zu testen. Sicherungs-Workflows ohne Tests bergen das Risiko, dass das System nicht wiederhergestellt werden kann.
R.3	Verstehen Sie die schwächsten Glieder in Ihrer Systemzuverlässigkeitsstrategie. Dabei kann es sich um technische, personelle oder prozessuale Lücken handeln. Die Systemverfügbarkeit und SLA-Garantien sind nur so gut wie das schwächste Support-System oder die schwächste Komponente.
R.4	Verwenden Sie “niedere” Umgebungen, um Konfigurationen zu spiegeln und Zuverlässigkeitsstrategien wie hohe Verfügbarkeit und Sicherungsprozesse zu testen.
R.5	Definieren Sie Eskalationspfade, um sicherzustellen, dass Probleme schnell den richtigen Mitarbeitern gemeldet und Maßnahmen ergriffen werden können, um Probleme zu lösen.
R.6	Beschäftigen Sie sich mit den Benutzer-Workflows – ein Service kann aufgrund einer einfachen Zustandsprüfung melden, dass er ordnungsgemäß ausgeführt wird, und dennoch vom Benutzer als Systemausfall betrachtet werden, wenn der Benutzer-Workflow nicht erfolgreich ist. Das Verständnis realer Benutzer-Workflows kann dabei helfen, den problematischen Service oder die problematische Komponente schnell einzugrenzen und das Problem zu beheben, das vom Benutzer erkannt wurde.

Best Practices für die Zuverlässigkeit

In diesem Thema