Checkmk-Integration
xyva.ai verbindet sich mit Checkmk, um Monitoring-Daten mit Testergebnissen zu korrelieren. So können Testfehler im Kontext der Infrastruktur-Gesundheit bewertet werden.
Einrichtung
Die Konfiguration erfolgt unter Einstellungen → Integrationen → Checkmk:
| Parameter | Beschreibung |
|---|---|
| Checkmk-URL | Basis-URL der Checkmk-Instanz (z. B. https://monitoring.example.com/site) |
| Benutzername | Checkmk-Benutzer mit API-Zugriff |
| Passwort / Secret | Automation-Secret des Benutzers |
Tipp
Erstellen Sie in Checkmk einen dedizierten Automation-Benutzer mit Lesezugriff. Unter Setup → Users kann ein Benutzer mit Automation-Secret angelegt werden.
Service-Health-Status
Nach erfolgreicher Verbindung zeigt xyva den aktuellen Zustand der überwachten Services:
- OK — Service läuft fehlerfrei
- WARN — Warnungen, die Aufmerksamkeit erfordern
- CRIT — Kritischer Zustand, Handlung erforderlich
- UNKNOWN — Status konnte nicht ermittelt werden
Die Service-Liste kann nach Host, Service-Gruppe oder Status gefiltert werden.
Hinweis
xyva fragt den Status über die Checkmk REST-API ab. Die Aktualisierung erfolgt beim Öffnen der Ansicht und kann manuell ausgelöst werden.
Alert-Korrelation mit Testfehlern
Die Kernfunktion der Checkmk-Integration ist die Korrelation von Monitoring-Alerts mit Testfehlern:
- Wenn ein Test fehlschlägt, prüft xyva automatisch, ob zeitgleich Checkmk-Alerts für die betroffene Infrastruktur vorliegen
- Findet sich ein passender Alert, wird dieser im Testergebnis als mögliche Ursache angezeigt
- Dies hilft bei der Unterscheidung zwischen echten Anwendungsfehlern und infrastrukturbedingten Ausfällen
Achtung
Die Korrelation basiert auf zeitlicher Nähe und Host-Zuordnung. Sie ersetzt keine detaillierte Fehleranalyse, liefert aber wertvolle Hinweise.
Anwendungsbeispiel
Ein E2E-Test schlägt mit einem Timeout fehl. xyva erkennt, dass der zugehörige Webserver in Checkmk zeitgleich einen CRIT-Alert aufweist. Im Testergebnis erscheint der Hinweis:
Infrastruktur-Alert erkannt: HTTP-Service auf
web-prod-01ist kritisch seit 14:32 Uhr.
Nächste Schritte
- Ops Portal — Infrastruktur-Dashboard
- Swarm QA — Automatisierte Agenten-Tests
