Skip to content

Checkmk-Integration

xyva.ai verbindet sich mit Checkmk, um Monitoring-Daten mit Testergebnissen zu korrelieren. So können Testfehler im Kontext der Infrastruktur-Gesundheit bewertet werden.

Einrichtung

Die Konfiguration erfolgt unter Einstellungen → Integrationen → Checkmk:

ParameterBeschreibung
Checkmk-URLBasis-URL der Checkmk-Instanz (z. B. https://monitoring.example.com/site)
BenutzernameCheckmk-Benutzer mit API-Zugriff
Passwort / SecretAutomation-Secret des Benutzers

Tipp

Erstellen Sie in Checkmk einen dedizierten Automation-Benutzer mit Lesezugriff. Unter Setup → Users kann ein Benutzer mit Automation-Secret angelegt werden.

Service-Health-Status

Nach erfolgreicher Verbindung zeigt xyva den aktuellen Zustand der überwachten Services:

  • OK — Service läuft fehlerfrei
  • WARN — Warnungen, die Aufmerksamkeit erfordern
  • CRIT — Kritischer Zustand, Handlung erforderlich
  • UNKNOWN — Status konnte nicht ermittelt werden

Die Service-Liste kann nach Host, Service-Gruppe oder Status gefiltert werden.

Hinweis

xyva fragt den Status über die Checkmk REST-API ab. Die Aktualisierung erfolgt beim Öffnen der Ansicht und kann manuell ausgelöst werden.

Alert-Korrelation mit Testfehlern

Die Kernfunktion der Checkmk-Integration ist die Korrelation von Monitoring-Alerts mit Testfehlern:

  • Wenn ein Test fehlschlägt, prüft xyva automatisch, ob zeitgleich Checkmk-Alerts für die betroffene Infrastruktur vorliegen
  • Findet sich ein passender Alert, wird dieser im Testergebnis als mögliche Ursache angezeigt
  • Dies hilft bei der Unterscheidung zwischen echten Anwendungsfehlern und infrastrukturbedingten Ausfällen

Achtung

Die Korrelation basiert auf zeitlicher Nähe und Host-Zuordnung. Sie ersetzt keine detaillierte Fehleranalyse, liefert aber wertvolle Hinweise.

Anwendungsbeispiel

Ein E2E-Test schlägt mit einem Timeout fehl. xyva erkennt, dass der zugehörige Webserver in Checkmk zeitgleich einen CRIT-Alert aufweist. Im Testergebnis erscheint der Hinweis:

Infrastruktur-Alert erkannt: HTTP-Service auf web-prod-01 ist kritisch seit 14:32 Uhr.

Nächste Schritte

Local-first QA orchestration.