Wichtige Warteschlangen, Dämonen, NWASe, Aktionen, Zustände und Programme werden von PEIQ im Monitoring überwacht, damit produktionskritische Prozesse nicht unbemerkt über einen längeren Zeitraum ausfallen. Sobald ein Fehler vom Monitoring bemerkt wird, wird es gemeldet.
Zentrale Funktionalitäten
Frühwarnsystem
Überwachung betriebsrelevanter Komponenten
Inhaltsverzeichnis
Allgemeine Beschreibung
Das Monitoring dient der Überwachung betriebsrelevanter Komponenten. Ziel des proaktiven Monitorings ist es, eine frühe Reaktion im Falle einer produktionsrelevanten Störung zu gewährleisten.
Um die Stabilität von PRINT NGEN zu gewährleisten, werden folgende Komponenten im Monitoring überwacht:
Warteschlangen
Verzeichnisse und Unterverzeichnisse
Dämonen
NWASe
Aktionen
Zustände
Im Hintergrund von PRINT NGEN laufen zahlreiche automatisierte Hintergrundprozesse, sogenannte Warteschlangen. Dazu gehören zum Beispiel Replikationen vom Test- auf das Produktivsystem, Import- und Exportworkflows oder auch regelmäßige Löschläufe zur Datenbereinigung. Um sicherzustellen, dass keine produktionskritischen Prozesse unbemerkt über einen längeren Zeitraum ausfallen, werden wichtige Warteschlangen daher von uns überwacht. Zusätzlich werden teilweise auch zugehörige Verzeichnisse auf liegengebliebene Dateien hin überprüft.
Sobald ein Fehler vom Monitoring bemerkt wird, wird dieser intern gemeldet. Die Meldungen laufen je nach Priorität auf verschiedenen Wegen ein und werden nach je nach Priorität bearbeitet. Unsere Warteschlangen sind von 1 bis 4 priorisiert. Ergibt die Analyse, dass es sich bei dem Fehler um eine andauernde Störung handelt, erfolgt eine proaktive Information an die Kund:innen.
Warteschlangen
Jede Warteschlange mit Prioritäts-Angabe (Prio 1-3) wird überwacht. Hat eine Warteschlange keine Prio-Angabe, wird sie nicht überwacht.
Prioritäten der Warteschlange
Prio 1
Produktionsrelevant (sofortige Fehlerbehebung/Workaround nötig)
Produktions-Deadlines gefährdet
Ausmaß der betroffenen Personenkreise groß (Abteilungsübergreifend, Redaktion etc.)
Ausmaß der beeinträchtigten Funktionen (mehrere Funktionen fallen aus (kritische Kette), eine essenzielle Funktion funktioniert nicht etc.)
Reaktionszeit vertraglich vorgegeben (ca. zwischen 30min - 2h)
Prio 2
Wesentliche Beeinträchtigung (z. B. nur eine Funktion, eine Abteilung)
Tagesaktuelle Importe/Exporte (TV, Wetter, Börse, E-Paper etc.)
Längerfristige Deadlines gefährdet (Monatsabrechnungen, Honorar etc.)
Reaktionszeit innerhalb der nächsten Stunden
Prio 3
Gering beeinträchtigt (wichtigste Funktionen sind verfügbar)
Reaktion nicht sofort nötig, im Laufe der Woche
Nicht produktionskritisch
Problem bei Einzelperson
Prio 4
Produktion nicht beeinträchtigt
Nachrangige Hintergrundprozesse
Werden nicht überwacht
Überwachte Parameter bei Warteschlangen mit Prio
Folgende Parameter werden regelmäßig vom Monitoring geprüft:
Läuft die Warteschlange noch?
Arbeitet sie im vorgegebenen Intervall?
Dauert der einzelne Workflow länger als die vorgegebene Maximaldauer?
Bei relevanten Dateien: Ist die Datei jünger, als das vorgegebene Maximalalter?
Verzeichnisse & Unterverzeichnisse
Standardmäßig wird für eine Warteschlange nur das Verzeichnis überwacht, das gemäß Definition der Queue angegeben ist. Ist an der Warteschlange der Parameter “Unterverzeichnis=ja” eingestellt, wird nicht nur das eigentliche Verzeichnis überwacht, sondern auch dessen Unterverzeichnisse.
Ausschließliches Überwachen eines bestimmten Unterverzeichnisses
Ist an der Warteschlange beim Parameter “Subfolder” ein Wert gesetzt, bedeutet dies, dass nur der hier angegebene Unterordner des Pfades aus der Abbildung geprüft wird.
Es können also verschiedene Warteschlangen mit der gleichen Queue eingetragen werden, die aber dann jeweils einen anderen “Subfolder” haben. Dies spart Einzel-Einträge in der Abbildung und ermöglicht die dedizierte Überwachung verschiedener Unterordner auch mit verschiedenen Prios.
Auch wenn vereinzelt Fehler vorkommen, die nicht vom PEIQ-Monitoring erfasst werden, kann das Monitoring-System einen Großteil auftretender Fehler erkennen und beheben, bevor sie sich auf den alltäglichen Betrieb auswirken - häufig sogar, noch bevor sie einem bzw. einer Benutzer:in auffallen.