Rapid Alert System for Servers

post-image

Der Auftraggeber panagenda entwickelt Standard-Software und in diesem Zusammenhang auch eine Server Monitoring-Lösung, die es IT-Administratoren in Unternehmen mit mehreren Servern ermöglicht, Performance-Probleme einzelner Server frühzeitig zu erkennen und die Fehlerursache zu analysieren.

Dabei werden laufend Daten erhoben, die die Funktions- und Leistungsfähigkeit jedes Servers messen. Diese Daten können sehr umfangreich sein, da Server je nach geschalteten Sensoren zwischen 1.000 und 2.000 Datenpunkte alle 10-15 Minuten produzieren.

Ziel des Projekts ist es, auf Basis der erhobenen Daten frühzeitig Serverausfälle zu erkennen bzw. diese vorhersagen zu können. Dazu mussten entsprechende Methoden entwickelt werden, die Methoden müssen flexibel und mitlernend sein, da sich die Ansprüche bzw. das Verhalten von Servern über deren Laufzeit laufend ändert.

Das Verhalten der wichtigsten Parameter im Regulärbetrieb wurde mittels statistischen ARIMA-Modellen sowie mit künstlichen neuronalen Netzen vorhergesagt. Bei dieser Klassifizierung handelte es sich im Wesentlichen um eine Ausreißer-Analyse, die unter anderem mittels einer One-Class Support Vector Machine und der Angle-Based Outlier Detection Methode erfolgte.

Die angesprochenen Methoden wurden mehrfach getestet und in JAVA implementiert.