Anomaly Detection im Maschinenbetrieb – Unüberwachte ML-Modelle

Das grundlegende Problem bei der Erkennung von Maschinenverschleiß durch ML: Schadensdaten sind per Definition selten. Eine CNC-Fräse läuft tausende Stunden im Normalzustand, bevor ein Lagerschaden auftritt. Ein überwachtes Klassifikationsmodell (Gut vs. Schlecht) wäre chronisch untertrainiert auf der Schadensklasse.

Unüberwachte Anomalieerkennung (Unsupervised Anomaly Detection) löst dieses Dilemma: Das Modell trainiert ausschließlich auf Normalzustand-Daten, lernt deren statistische Struktur, und meldet Datenpunkte, die von diesem erlernten Normalzustand abweichen, als Anomalien – unabhängig davon, ob der Schadenstyp vorher bekannt war.

Algorithmen im Vergleich

Autoencoder (Deep Learning)

Ein Autoencoder ist ein neuronales Netz mit Encoder-Bottleneck-Decoder-Architektur. Beim Training auf Normalzustand-Zeitreihen lernt das Netz, Eingangssignale durch einen niedrigdimensionalen Engpass zu komprimieren und zu rekonstruieren. Im Betrieb: Wenn eine anomale Sequenz eingespeist wird, rekonstruiert der Autoencoder sie schlecht (hoher Rekonstruktionsfehler), da er nur Normalzustand kennt. Der Rekonstruktionsfehler dient als Anomalie-Score. Besonders effektiv für multivariate Zeitreihen (10+ Sensoren gleichzeitig).

Isolation Forest

Isolation Forest (Liu et al., 2008) nutzt eine intuitive Eigenschaft: Anomalien sind selten und statistisch isoliert – sie lassen sich schneller von der Datenwolke isolieren als Normalpunkte. Das Modell baut zufällige Entscheidungsbäume auf und misst, wie viele Splits nötig sind, um einen Datenpunkt zu isolieren. Kurze Isolation = Anomalie. Sehr effizient, robust gegen hochdimensionale Daten, kein Deep-Learning-Framework nötig.

Local Outlier Factor (LOF)

LOF berechnet für jeden Datenpunkt die lokale Dichte im Vergleich zu seinen k nächsten Nachbarn. Punkte in dünn besiedelten Regionen der Datenwolke (geringe lokale Dichte relativ zur Nachbarschaft) erhalten hohe LOF-Scores. Gut geeignet für Cluster-Strukturen im Datensatz, bei denen globale Schwellenwerte versagen.

Multivariate vs. univariate Anomalieerkennung

Univariate Ansätze (statistischer Prozessregelung, SPC, mit Grenzwerten auf einzelnen Signalen) werden von multivariaten ML-Modellen in komplexen Maschinen übertroffen: Ein Lager kann gleichzeitig erhöhte Vibration und erhöhte Temperatur aufweisen, wobei jedes Signal einzeln noch im Normbereich liegt. Nur die gemeinsame Betrachtung beider Signale enthüllt die Anomalie. Autoencoder und ähnliche multivariate Modelle erkennen genau diese Korrelationsbrüche.

Schwellenwert-Definition und Alert-Management

Die Kalibrierung des Anomalie-Schwellenwerts ist kritisch: Ein zu niedriger Schwellenwert erzeugt False Positives (Alarm-Flood, Verlust von Vertrauen), ein zu hoher Schwellenwert verpasst echte Schäden. Best Practice: Schwellenwert so setzen, dass in einem Kalibrierungsdatensatz aus bekannten Normalzustand-Perioden die False-Positive-Rate ≤0,1 % beträgt. Dann in der Praxis mit manuellen Rückmeldungen der Instandhaltung (war der Alarm berechtigt?) iterativ nachkalibrieren.

Erklärbarkeit (XAI): Für die Akzeptanz im Betrieb ist es entscheidend, dass der Algorithmus nicht nur „Anomalie" meldet, sondern auch, welche Sensorsignale die Abweichung treiben. SHAP-Werte (SHapley Additive exPlanations) ermöglichen dies auch für Black-Box-Modelle wie Autoencoder.

Anomaly Detection: schleichenden Verschleiß mathematisch erkennen

Algorithmen im Vergleich

Autoencoder (Deep Learning)

Isolation Forest

Local Outlier Factor (LOF)

Multivariate vs. univariate Anomalieerkennung

Schwellenwert-Definition und Alert-Management

Weiterführende Themen

Predictive Maintenance

Schwingungsanalyse

Betriebssimulation