Grundpfeiler “Observability”

Unternehmenssysteme sind häufig komplex und multifunktional. Um auf einem hohen Verfügbarkeits- oder Serviceniveau zu arbeiten und sicherzustellen, dass alle Probleme effektiv behoben werden können, müssen diese für das Engineering- und IT-Personal gut verständlich und transparent beobachtbar sein. Um diese Unternehmenssysteme effektiv zu verwalten und zu betreiben, müssen die Mitarbeiter und verantwortlichen Teams Zugriff auf Informationen zur Ausführung des Systems sowie zum Betriebsstatus des Systems, der Anwendungen und der unterstützenden Services haben. Observability ist ein häufig verwendeter IT-Begriff zur Beschreibung der Verfügbarkeit von Informationen zu den internen Abläufen eines Systems, z. B. die Compute-Nutzung eines Datenbank-Clusters, die Kennwerte für die Speicherein- und -ausgabe für einen Anbieter oder die Anzahl der Anforderungen und Aktivitäten über verschiedene Apps oder Services hinweg.

Bedeutung der Observability

Die Bedeutung der Observability unterstützt zwei miteinander verbundene Ziele des Systembetriebs: dass das System einen stabilen Zustand beibehält, der konsistent und stabil ist, und dass die Unterstützungsteams schnell auf auftretende Probleme reagieren und fundierte, effektive Änderungen vornehmen können, um das System wieder in einen erwarteten Zustand zu versetzen. Observability ermöglicht dies, indem sie einfachen Zugriff auf konsistente, detaillierte Informationen zum Systembetrieb bietet, sodass abweichende Berichte identifiziert, bewertet und von den Unterstützungsteams bearbeitet werden können.

Telemetrie, Überwachung und Observability im Vergleich

Telemetrie, Überwachung und Observability sind verwandte Konzepte, haben jedoch unterschiedliche Bedeutungen. Man kann Telemetrie als eine Teilmenge der Überwachung betrachten, die wiederum eine Teilmenge der Observability ist:

telemetry-monitoring-observability.png

Telemetrie ist die Sammlung von Informationen über den Zustand eines Systems. Gut strukturierte Systeme definieren und erfassen Telemetriedaten für ArcGIS-Komponenten. Diese Systeme stellen sicher, dass Anwendungen, Workflows und benutzerdefinierte Komponenten regelmäßige Statusberichte erstellen, Aktivitäten konsistent protokollieren oder API-Methoden bereitstellen, damit ein externer Prozess Status und Fortschritt abfragen und überwachen kann.

Überwachungslösungen erweitern die Telemetriedaten, indem sie nicht nur Informationen über den Zustand eines Systems sammeln, sondern diese auch visualisieren und mit vordefinierten Schwellenwerten vergleichen. Überwachungslösungen verwenden typischerweise Warnungen und Dashboards, um einen Überblick über den Systemzustand zu geben und Leistungsprobleme oder Auffälligkeiten aufzudecken. Da diese Warnungen und Dashboards vordefiniert sein müssen, ist die Überwachung besonders hilfreich im Hinblick auf Probleme, die vorhersehbar sind.

Ein vollständig beobachtbares System erweitert die Überwachung, indem es Werkzeuge zur Analyse von Informationen über das System bereitstellt. Neben vordefinierten Warnungen und Dashboards, die beschreiben, was im System passiert, hilft Observability dabei, die Gründe zu verstehen. Mit diesen zusätzlichen Funktionen können Sie komplexe und unvorhersehbare Probleme besser bewältigen, als es allein mit der Überwachung möglich ist.

Observability von ArcGIS-Software

Viele ArcGIS-Softwarekomponenten enthalten Werkzeuge oder Muster, die die Observability unterstützen, einschließlich Protokollierung, direkter Überwachung und Erstellung von Berichten zu Status, Nutzung oder Performance. Die Nutzungsberichterstattung von ArcGIS Online ermöglicht es Administratoren, regelmäßig über Nutzung und Aktivitäten zu berichten. ArcGIS Pro beinhaltet sowohl das Werkzeug “Diagnostic Monitor” als auch das Werkzeug “Performance Assessment Tool” zur Unterstützung bei der Problembehandlung und Überwachung von Workflows. Zu den Observabiliy-Funktionen von ArcGIS Enterprise gehören Service- und Systemkennwerte, umfangreiche Protokollierung und die Möglichkeit für die Integration mit Observability-Werkzeugen von Drittanbietern, z. B. Prometheus.

Best Practices für die Observability

Kennung Best Practice
O.1 Stellen Sie sicher, dass die unterstützenden Systemtechniker mit den vorhandenen Observability- und Überwachungsoptionen für ArcGIS-Softwareprodukte vertraut sind.
O.2 Beginnen Sie mit der Überwachung wichtiger Workflows und nicht aller Systemvorgänge, um sich auf die Auswirkungen und den Nutzen zu konzentrieren. Achten Sie darauf, dass das Rauschen der Überwachungstätigkeit nicht dafür sorgt, dass wichtige Signale übersehen werden.noise
O.3 Integrieren Sie bestehende organisatorische Observability-Investitionen, wie z. B. ein vorhandenes Überwachungswerkzeug oder ein Reporting-Framework, um die Zusammenarbeit zu fördern und auf früheren Erfolgen aufzubauen.
Top