Eine der Hauptfunktionen des Monitoring Service von Uptrends sind die Warnmeldungen: Wenn ein Fehler durch die Prüfobjekte entdeckt wird, wirst du durch eine Warnmeldung benachrichtigt.
In der Uptrends Anwendung funktioniert dies wie folgt:
Wenn ein Monitoring-Check einen bestätigten Fehler zum Ergebnis hat, wird in der Anwendung von Uptrends ein Alarm erzeugt. Ein Alarm löst das Senden einer Warnmeldung an einen Operator oder an eine externe Anwendung aus.
Für diesen Vorgang sind diese vier Definitionen erforderlich: Prüfobjekt, Fehlerbedingung, Meldedefinition und Integration. Sie geben an, ob und wann ein Alarm erzeugt und welche Art von Warnmeldung gesendet wird.
Mit diesem Artikel sehen wir uns die Grundlagen an, wie ein Check zu einer Meldung wird.
Checks durch Prüfobjekte
Zu Beginn stehen die Checks durch die Prüfobjekte, die in einem von dir bestimmten Intervall ausgeführt werden. Der Check vom Prüfobjekt umfasst Standardüberprüfungen je nach Prüfobjekttyp, zum Beispiel auf Verfügbarkeit. Dazu kannst du eigene Fehlerbedingungen einrichten. Darunter fallen zum Beispiel Höchstgrenzen zu Ladezeiten oder eine Übereinstimmungsabfrage.
Der Knowledge-Base-Artikel Fehlerbedingungen erläutert im Detail, wie Fehlerbedingungen konfiguriert werden können.
Wenn das Prüfobjekt ein Problem aufdeckt, weil der Standardcheck fehlschlägt oder eine Fehlerbedingung erfüllt wird, wird ein Fehler angezeigt.
Fehler
Alle Fehler werden unter Fehler Übersicht (Menüelement Dashboards > Synthetics – Fehler Übersicht) aufgeführt. Du kannst ändern, welche Art Fehler (OK, unbestätigt, bestätigt) und für welchen Zeitraum diese angezeigt werden sollen. Diese Einstellungen können für das gesamte Dashboard oben am Dashboard vorgenommen werden. Darüber hinaus lässt sich jedes einzelne Dashboard auch individuell einrichten. Fahre mit der Maus über die rechte Ecke der Kachel, um zu ihren Einstellungen zu gelangen.
Das folgende Beispiel einer Fehler-Übersicht zeigt unbestätigte (gelb) und bestätigte (rot) Fehler des letzten Monats:
Das erste Auftreten eines Fehlers wird als unbestätigter Fehler betrachtet. Es kann ein vorübergehendes Vorkommen oder ein Problem am Checkpoint sein. Deshalb wird ein zweiter Check von einem anderen Checkpoint durchgeführt. Wenn dieser Checkpoint ebenfalls denselben Fehler meldet, wird der Fehler als bestätigt erachtet. Nur bestätigte Fehler führen zu einem Alarm.
Weitere Informationen hierzu findest du im Artikel Nicht bestätigte und bestätigte Fehler .
Abfolgen von Fehlern
Es gibt unterschiedliche Szenarien für eine Abfolge von Fehlern, die im Bild unten dargestellt werden:
- Ein unbestätigter Fehler, gefolgt von einem OK-Ergebnis. Dies erzeugt keinen Alarm.
- Ein unbestätigter Fehler, gefolgt von einem bestätigten Fehler, dann gefolgt von einem OK-Ergebnis. Dies führt zu einem Alarm, wenn deine Meldedefinition so eingestellt ist, dass sie „eine Warnmeldung, wenn 1 oder mehr Fehler aufgetreten“ sind, generiert.
- Eine Anzahl (n) unbestätigter und bestätigter Fehler treten nacheinander auf. Dies führt zu einem Alarm, wenn deine Meldedefinition so eingestellt ist, dass sie „eine Warnmeldung, wenn n oder mehr Fehler aufgetreten“ sind, generiert. Alternativ kannst du ein Zeitlimit für Fehler einsetzen. Wenn die Abfolge von Fehlern dieses Zeitlimit erreicht, wenn also beispielsweise ein Fehler länger als fünf Minuten auftritt, wird ein Alarm erzeugt.
Alarme
Die Meldedefinition steuert die Erzeugung von Warnmeldungen für unterschiedliche Eskalationsstufen. Die Eskalationsstufen werden verwendet, um Warnmeldungen in Phasen auszulösen und die ausgewählten Operatoren auf die richtige Weise zu benachrichtigen. Dabei werden die Dringlichkeit des Problems und die gesteigerte Dringlichkeit bei Fortbestehen des Problems berücksichtigt.
Für jede Stufe kannst du eingeben, ob eine Warnmeldung erzeugt wird, welche Operatoren (Gruppen) benachrichtigt werden, wann das Zeitlimit überschritten ist (Fehler dauern länger als x Minuten), oder ob eine Warnmeldung erzeugt wird, nachdem eine Anzahl von Fehlern aufgetreten ist (n oder mehr Fehler sind aufgetreten). Alle Fehler müssen bestätigte Fehler sein. Unbestätigte Fehler werden bei diesen Bedingungen nicht berücksichtigt.
Zusätzlich zur ersten Warnmeldung kannst du einen oder mehrere Erinnerungsalarme einrichten. Du kannst eine Maximalzahl an Erinnerungen und das Intervall, in dem sie erzeugt werden sollen, bestimmen. Diese Option ist für jede Eskalationsstufe individuell einstellbar.
Die Knowledge-Base-Artikel Erstellen von Meldedefinitionen und Eskalationsstufen zu Alarmen enthalten weitere Informationen zu Meldedefinitionen.
Hinweis: Im Prüfobjekt muss Warnmeldungen generieren aktiviert sein, damit überhaupt Warnmeldungen erzeugt werden.
Wenn der Fehler aufgelöst wurde (wenn dieselbe Prüfung also ein OK statt eines Fehlers zurückgibt) wird eine Entwarnungsmeldung (OK-Meldung) erzeugt.
Alle Alarme werden in der Alarmierungshistorie (Menüelement Alarme > Alarmierungshistorie) aufgelistet. Die auf einen Fehler beruhenden Alarme werden rot markiert, OK-Meldungen grün. Solang der Fehler nicht behoben und keine Entwarnungsmeldung erzeugt wird, gilt der Alarm als aktiver Alarm. Alle aktiven Alarme werden unter Aktuelle Alarmierungen (Menüelement Alarmierung > Aktuelle Alarmierungen) aufgelistet.
Suchst du nach einer bestimmten, von dir erstellten Meldedefinition? Du kannst die Suche von Uptrends verwenden, um sie schnell zu finden.
Benachrichtigungen
Du hast jetzt bereits ein grundlegendes Alarmierungssystem. Die aktiven Alarme erscheinen im Dashboard Aktuelle Alarmierungen. Um einen Alarm jedoch zu bemerken, müssten deine Operatoren ständig auf das Dashboard schauen.
Du kannst die Alarmierung weiter automatisieren, indem du Benachrichtigungen an Personen oder Systeme sendest, um sie über die Fehlersituation zu informieren. In dem Fall kannst du Integrationen und Eskalationsstufen (in einer Meldedefinition) einrichten.
In den Eskalationsstufen konfigurierst du, wer welche Art Nachricht bekommt – auf der Grundlage, wie lange oder wie häufig ein Fehler aufgetreten ist. Zudem können Erinnerungen gesendet werden, damit ein Fehler auch wirklich beachtet wird. Weitere Informationen findest du unter Eskalationsstufen .
Um nach der Erzeugung eines Alarms eine Benachrichtigung zu senden, musst du die Alarmierung durch Integrationen innerhalb der Meldedefinition einrichten.
Die Integrationen zur Warnung per Telefon (Sprachnachricht), SMS und E-Mail sind bei Uptrends standardmäßig vorhanden. Andere Integrationen mit externen Systemen wie Slack sind vordefiniert, müssen aber von dir eingerichtet werden. Darüber hinaus kannst du eine vollständig benutzerdefinierte Integration für dein externes System einrichten. Gehe zu
, um eine Liste der Integrationen in deiner Anwendung zu erhalten. Wenn die Integration hier existiert, kannst du sie in deiner Einrichtung unter Alarmierung durch Integrationen nutzen.Unter Was sind Integrationen? findest du mehr über die Gesamtheit der Optionen zum Senden von Warnmeldungen an Personen oder an externe Systeme. Im Knowledge-Base-Artikel Benutzerdefinierte Integrationen einrichten erfährst du mehr über das Senden einer Mitteilung an ein System, für das keine Standarddefinition zur Integration vorhanden ist.
Dies ist ein Beispiel für Benachrichtigungen aufgrund desselben Alarms, per E-Mail und an Slack:
Testen von Warnmeldungen
Du solltest dich darauf verlassen können, dass Benachrichtigungen ausgesendet werden, wenn eine Situation entsteht, die deine Aufmerksamkeit erfordert.
Im ersten Schritt solltest du sicherstellen, dass das Senden von Warnmeldungen funktioniert. Der KB-Artikel Testen von Warnmeldungen beschreibt für die unterschiedlichen Integrationen, wie du prüfen kannst, ob die Benachrichtigungen tatsächlich gesendet werden.
Im Abschnitt Problembehebung der Überblicksseite von „Alarme“ in der Knowledge Base findest du Tipps zur Problembehebung.