Berechnung der Verfügbarkeit und Ausfallzeiten

Verfügbarkeits- und Ausfallzeit-Berechnungen sind die Grundlage für mehrere Metriken in den Datenkacheln deines Dashboards und deiner Service Level Agreements (SLAs). Sehen wir uns an, wie diese Berechnung erfolgt und welche Faktoren sie beeinflussen.

Der Double-Check von Uptrends

Wenn ein Fehler auf deiner Website oder deinem Server verzeichnet wird, führt Uptrends immer eine zweite Prüfung von einem anderen Checkpoint aus, um den Fehler zu bestätigen. Deshalb siehst du bei Ausfällen immer ein Muster von nicht bestätigten und bestätigten Fehlern in deinen Website Monitoring-Dashboards.

So funktioniert es beim Standard-Monitoring. Wenn du das Parallel-Monitoring einsetzt, gibt es keine doppelte Prüfung. Der Artikel Fehler und Alarmierung beim Parallel-Monitoring erläutert den Unterschied.

Tipp: Um eine detaillierte Analyse der genauen Messungen und der entdeckten Fehler zu erhalten, siehe dir bitte das Dashboard Prüfobjektprotokoll im Menü unter Überwachung > Prüfobjektprotokoll an.

Wie wird die Verfügbarkeitsrate berechnet?

Die Art, wie die Verfügbarkeit berechnet wird, ist einfach: Nimm die Anzahl der Sekunden, die dein Prüfobjekt ausgefallen ist (in einem bestimmten Zeitrahmen) und dividiere dies durch die Gesamtanzahl der Sekunden, die dein Prüfobjekt in diesem Zeitrahmen überwacht wurde. Daraus ergibt sich der Prozentsatz der Ausfälle, der dann von 100 % subtrahiert wird, um die Verfügbarkeitsrate zu erhalten.

Tipp: SLAs nennen die Verfügbarkeit als Prozentzahl, aber wie viel Zeit steckt tatsächlich dahinter? Nutze den kostenlosen SLA- und Verfügbarkeitsrechner, um Ausfälle in Sekunden und in Prozentangaben zu konvertieren und umgekehrt.

Beispiel

Nehmen wir an, du hast deine Website in einer Zeit von 24 Stunden (was 86.400 Sekunden sind) überwacht und in diesem Zeitraum war die Website 10 Minuten (600 Sekunden) ausgefallen. Um die Verfügbarkeits- und Ausfallraten zu erhalten, erfolgt die folgende Berechnung:

Gesamtzeit, in der deine Website ausgefallen war: 600 Sekunden Gesamtzeit, in der deine Website überwacht wurde: 86.400 Sekunden Ausfallrate = 600 Sekunden / 86.400 Sekunden = 0,0069 = 0,69 % Verfügbarkeitsrate = 100 % - 0,69% = 99,31 %

Tipp: Spiele etwas mit den Daten, die dein Account anzeigt, um die tatsächlichen Sekundenzahl zu erhalten. Die benutzerdefinierten Berichtskacheln des Typs Datenliste und Datendiagramm ermöglichen dir, die Sekundenzahlen anzuzeigen, in denen deine Prüfobjekte Verfügbarkeit und Ausfälle verzeichneten. Rufe eine Kachel auf und öffne das Dreipunkte-Menü , um zu den Kacheleinstellungen zu gelangen, einschließlich der unterschiedlichen Messwerte, die du auswählen kannst.

Einfluss von Prüfobjektergebnissen

Wie berücksichtigt Uptrends den Zeitraum zwischen unterschiedlichen Prüfobjektergebnissen (OK, nicht bestätigte und bestätigte Fehler)? Wird die Zeit zwischen einem nicht bestätigten und einem betätigten Fehler als Verfügbarkeit oder als Ausfall erachtet?

Die Abbildung unten zeigt mögliche Abfolgen von Prüfergebnissen und wie die Zeiträume berücksichtigt werden. Natürlich gibt es bei einem langfristigen Monitoring eines Service oder Servers viele aufeinanderfolgende Prüfergebnisse. Aber alle Ergebnisse können in die folgenden Situationen aufgeschlüsselt werden:

Illustration Reihenfolge der Prüfergebnisse

Detailliert können sich die Prüfergebnisse folgendermaßen ändern:

Unbestätigter Fehler -> bestätigter Fehler
Die Zeit zwischen den zwei Messungen wird als Ausfall betrachtet.

Bestätigter Fehler -> unbestätigter Fehler
Die Zeit zwischen zwei Messungen wird als Ausfall berechnet, da das Prüfobjekt noch in der Fehlerbedingung ist. Ein Prüfobjekt meldet einen Fehler, bis eine OK-Anzeige erfolgt.

Bestätigter Fehler -> OK
Die Zeit zwischen den zwei Messungen wird als Ausfall erachtet. Ein Prüfobjekt wird erst von dem Moment als verfügbar erachtet, an dem eine OK-Anzeige erfolgt.

OK -> nicht bestätigter Fehler
Die Zeit zwischen den zwei Messungen wird als Verfügbarkeit gezählt, da noch nicht sicher ist, dass es sich tatsächlich um einen Fehler handelt.

Unbestätigter Fehler -> OK
Die Zeit zwischen den zwei Messungen wird als verfügbar erachtet.

Welche Fehler zählen zur Ausfallzeit?

Bitte bedenke, dass alle Fehler berücksichtigt werden, wenn die Ausfallzeit berechnet wird.

Wenn du zum Beispiel Performance Limits bei den Fehlerbedingungen des Prüfobjekts eingibst und ein Performance Limit erreicht ist, wird für diese Bedingung ein Fehler gemeldet. Obwohl deine Website nicht wirklich einen Ausfall vorweist (aber die Performance unter deinen Grenzen liegt), zeigt sie eine Verfügbarkeit von weniger als 100 % auf, weil die Performance-Bedingungen nicht erfüllt wurden.

Wie wirken sich angehaltene Prüfobjekte auf die Verfügbarkeitsrate aus?

Wenn du ein Prüfobjekt pausierst, wird diese Zeit als „unbekannt“ registriert. Beachte in Bezug auf die Verfügbarkeitsberechnung, dass die Gesamtzahl Sekunden für den Status Unbekannt ebenfalls einbezogen und die unbekannte Zeit als Verfügbarkeit verzeichnet wurde. Die Formel für die Verfügbarkeitsrate lautet (Verfügbarkeit + unbekannt) / (Verfügbarkeit + Ausfallzeit + unbekannt), wobei Verfügbarkeit, Ausfallzeit und „unbekannt“ in Sekunden angegeben werden.

Dies wurde so eingerichtet, da viele Kunden es wünschten. Wenn du die Unbekannt-Zeiten aus der Verfügbarkeitsrechnung ausschließen möchtest, kannst du die Gesamtzeit der Verfügbarkeit und Ausfallzeiten in Sekunden abrufen und eine eigene Berechnung durchführen. Die Formel für die Verfügbarkeitsrate lautet Verfügbarkeit / (Verfügbarkeit + Ausfallzeit), wobei Verfügbarkeit und Ausfallzeit in Sekunden angegeben werden.

Wie wirkt sich die Wartung auf die Verfügbarkeitsrate aus?

Fehler, die während eines Wartungszeitraums auftreten, werden aus den Verfügbarkeitsberechnungen ausgeschlossen, sofern die Wartungsart des Wartungszeitraums auf Überwachung komplett deaktivieren gesetzt wurde (im Unterschied zu „Nur Benachrichtigungen deaktivieren“).

Digital Experience Monitoring

API Monitoring

Real User Monitoring

Eingebaute Funktionen

Mehr Funktionen

Vorteile für Teams

Maßgeschneidert für Ihre Branche

Was ist neu bei Uptrends

Entwickler (Uptrends API)

Integrationen

Über ITRS Uptrends

Wiki

Kostenlose Tools

Berechnung der Verfügbarkeit und Ausfallzeiten

Der Double-Check von Uptrends

Wie wird die Verfügbarkeitsrate berechnet?

Beispiel

Einfluss von Prüfobjektergebnissen

Welche Fehler zählen zur Ausfallzeit?

Wie wirken sich angehaltene Prüfobjekte auf die Verfügbarkeitsrate aus?

Wie wirkt sich die Wartung auf die Verfügbarkeitsrate aus?