Wichtige Warteschlangen, Dämonen, NWASe, Aktionen, Zustände und Programme werden von PEIQ im Monitoring überwacht, damit produktionskritische Prozesse nicht unbemerkt über einen längeren Zeitraum ausfallen. Sobald ein Fehler vom Monitoring bemerkt wird, wird es gemeldet.
Zentrale Funktionalitäten
Frühwarnsystem
Überwachung betriebsrelevanter Komponenten
Inhaltsverzeichnis
Allgemeine Beschreibung
Das Monitoring dient der Überwachung betriebsrelevanter Komponenten. Ziel des proaktiven Monitorings ist es, eine frühe Reaktion im Falle einer produktionsrelevanten Störung zu gewährleisten.
Um die Stabilität von PRINT NGEN zu gewährleisten, werden folgende Komponenten im Monitoring überwacht:
Warteschlangen
Verzeichnisse und Unterverzeichnisse
Dämonen
NWASe
Aktionen
Zustände
Im Hintergrund von PRINT NGEN laufen zahlreiche automatisierte Hintergrundprozesse, sogenannte Warteschlangen. Dazu gehören zum Beispiel Replikationen vom Test- auf das Produktivsystem, Import- und Exportworkflows oder auch regelmäßige Löschläufe zur Datenbereinigung. Um sicherzustellen, dass keine produktionskritischen Prozesse unbemerkt über einen längeren Zeitraum ausfallen, werden wichtige Warteschlangen daher von uns überwacht. Zusätzlich werden teilweise auch zugehörige Verzeichnisse auf liegengebliebene Dateien hin überprüft.
Sobald ein Fehler vom Monitoring bemerkt wird, wird dieser intern gemeldet. Die Meldungen laufen je nach Priorität auf verschiedenen Wegen ein und werden nach je nach Priorität bearbeitet. Unsere Warteschlangen sind von 1 bis 4 priorisiert und orientieren sich an den vertraglich vorgegebenen Reaktionszeiten. Ergibt die Analyse, dass es sich bei dem Fehler um eine andauernde Störung handelt, erfolgt eine proaktive Information an die Kund:innen.
Auch wenn vereinzelt Fehler vorkommen, die nicht vom PEIQ-Monitoring erfasst werden, kann das Monitoring-System einen Großteil auftretender Fehler erkennen und beheben, bevor sie sich auf den alltäglichen Betrieb auswirken – häufig sogar, noch bevor sie einem bzw. einer Benutzer:in auffallen.
Warteschlangen
Jede Warteschlange mit Prioritäts-Angabe (Prio 1-3) wird überwacht. Hat eine Warteschlange keine Prio-Angabe, wird sie nicht überwacht.
Prioritäten der Warteschlange
Prio 1
Produktionsrelevant (sofortige Fehlerbehebung/Workaround nötig)
Produktions-Deadlines gefährdet
Ausmaß der betroffenen Personenkreise groß (Abteilungsübergreifend, Redaktion etc.)
Ausmaß der beeinträchtigten Funktionen (mehrere Funktionen fallen aus (kritische Kette), eine essenzielle Funktion funktioniert nicht etc.)
Beispiele: Produzieren von Seiten (= Seiten an die Druckerei schicken), E-Paper-Export, Re-Import der Bilder von der Repro, Import Agenturmeldungen, Sporttabellen-Import
Prio 2
Wesentliche Beeinträchtigung (z. B. nur eine Funktion, eine Abteilung)
Tagesaktuelle Importe/Exporte
Längerfristige Deadlines gefährdet (Monatsabrechnungen, Honorar etc.)
Reaktionszeit innerhalb der nächsten Stunden
Beispiele: Export von Bildern an die Repro, Import Motivdaten, Import PPI-Reply, Datawarehouse Export (für Export der Umsätze aus dem AZS), Export von Anzeigen an Asura via Workflowschema
Prio 3
Gering beeinträchtigt (wichtigste Funktionen sind verfügbar)
Reaktion nicht sofort nötig, im Laufe der Woche
Nicht produktionskritisch
Problem bei Einzelperson
Beispiele: Import redaktionelle Bilder via Hotfolder, Wetter-Import, Börse-Import, Logos-Import, nächtlicher Import von Replikationen
Prio 4
Produktion nicht beeinträchtigt
Nachrangige Hintergrundprozesse
Werden nicht überwacht
Überwachte Parameter bei Warteschlangen mit Prio
Folgende Parameter werden regelmäßig vom Monitoring geprüft:
Läuft die Warteschlange noch?
Arbeitet sie im vorgegebenen Intervall?
Dauert der einzelne Workflow länger als die vorgegebene Maximaldauer?
Bei relevanten Dateien: Ist die Datei jünger, als das vorgegebene Maximalalter?