Instandhaltungsstrategien Ereignisanalyse: Das echte Gold der Instandhaltung

Ein Gastbeitrag von Heino Brose* Lesedauer: 10 min |

Anbieter zum Thema

Effiziente Instandhaltung ist ein wesentlicher Aspekt einer ressourcenschonenden Industrie. Nur laufende Maschinen generieren Mehrwert und vermeiden Verschwendung. Deshalb müssen Instandhaltungsereignisse antizipiert, bewertet und mit Behandlungsalgorithmen versehen werden.

Auf Basis intelligenter Algorithmen lassen sich technische Systeme analysieren.
Auf Basis intelligenter Algorithmen lassen sich technische Systeme analysieren.
(Bild: frei lizenziert / Pixabay)

Das Ziel einer Instandhaltungsstrategie ist, ein Fehlerereignis vorhersagen zu können, um die Reparatur vor Eintritt des Ereignisses und damit vor einem Maschinenausfall durchzuführen. So ist es möglich, Stillstandzeiten einer Maschine zu planen, das notwendige Werkzeug und die Ersatzteile frühzeitig zu organisieren und das Personal rechtzeitig anzuweisen.

Warum aber setzt nicht jedes Unternehmen auf Predictive Maintenance, den Traum einer jeden Instandhaltung? Fehlerereignisse hochkomplexer technischer Systeme sind leider nicht so vorhersagbar, wie wir uns diese erhoffen, maximal eine von zehn potenziellen Fehlerursachen kann gut bis sehr gut vorhergesagt werden. Diese ist dann auch der perfekte Kandidat für Predictive Maintenance. Alle anderen besitzen einen zu geringen Prognostizierbarkeitsgrad. Ein typisches Beispiel hierfür ist eines der häufigsten Fehlerereignisse von hochvernetzten Systemen: der Leitungsfehler. Ursachen können unter anderem ein Kurzschluss, ein Bruch oder ein offener Stecker sein. Diese Gründe kündigen sich aber weder an, noch sind sie anderweitig vorhersagbar. Sie sollen jedoch ebenfalls erkannt und behoben werden. Hierfür benötigt man angepasste Instandhaltungsstrategien.

Was sind Ereignisse technischer Systeme?

Bei einem Ereignis wirkt eine definierte Fehlerursache und beeinflusst das technische System in seiner normalen Funktion. Um Fehlerursachen technischer Systeme besser zu verstehen, lassen sich die resultierenden Ereignisse grob in Kategorien mit gemeinsamen Eigenschaften einteilen.

Umgebungsereignisse haben ihre Ursachen in der Umgebung um das technische System herum oder sogar in der Umwelt. Es sind meist Überschreitungen von Grenzwerten physikalischer Größen. Beispiele können zu hohe Temperatur, zu hohe Luftfeuchtigkeit, zu hoher Luftdruck oder zu viele Staubpartikel sein.

Prozessereignisse sind Fehler, deren Ursachen im Produktlebenszyklus oder in seiner konkreten Umsetzung liegen. Das können fehlende Einstellungen oder Programmierungen des technischen Systems sein, aber auch nicht verfügbare Arbeitsmittel oder falsche Reihenfolgen bei der Anwendung des Produktionsprozesses.

Fehlerereignisse werden durch Fehler im System verursacht. Hierunter werden die klassischen Fehlerursachen verstanden. Defekte Steuergeräte, klemmende Aktoren oder Druckverlust sind Beispiele in dieser Kategorie.

Funktionsereignisse werden durch die Umsetzung einer Funktion des technischen Systems verursacht und führen zu Einschränkungen der Funktionalitäten. Aktivierung oder Deaktivierung von speziellen Systemfunktionen, funktionale Sicherheitsmechanismen, Überschreitungen von Zählwerten, Regelgrenzen oder Ergebnissen von Systemberechnungen sind Beispiele für mögliche Ursachen eines Funktionsereignisses.

Kommunikationsereignisse entstehen durch die Vernetzung mit anderen Systemen. Diese Ereignisse können auftreten durch Hinweise, Warnungen, Informationen oder Nachrichten von Geräten außerhalb des Systems. Aber auch externe Zugriffe und Interventionen durch Diagnosefunktionen werden hier zugeordnet. Beispiele sind falsche Freischaltcodes, Ereignismeldungen über das Internet oder die Durchführung eines Updates.

Jedes Ereignis in einer der fünf Kategorien führt zu einer Störung des normalen Funktionsablaufs des technischen Systems. Wichtig für die Produktivität der betroffenen Maschine oder Anlage ist dann in jedem Fall eine schnelle und gezielte Beseitigung des Fehlers oder ein schnelles Reagieren auf das Ereignis.

Bildergalerie

Schon beim ersten Betrachten der einzelnen Kategorien fällt auf, dass es auf der einen Seite Fehlerursachen gibt, die mit etwas Erfahrung vorauszusagen sind. Ein Beispiel hierfür ist der klassische Verschleiß von Teilen. Auf der anderen Seite gibt es aber auch Fehlerursachen, die nicht vorauszusagen sind. Kommunikationsereignisse oder Prozessereignisse liegen in der Regel außerhalb des betrachteten Systems und sind daher nicht voraussagbar.

Offensichtlich kann in obigen Fällen also mit unterschiedlichen Instandhaltungsstrategien gearbeitet werden. Um herausfinden, welche Instandhaltungsstrategie für welches Ereignis geeignet ist, gilt es, einen differenzierten Blick auf die einzelnen Ereignisse zu werfen.

Der Fingerabdruck technischer Ereignisse

Bei der Analyse alle Ereignisse eines technischen Systems, fällt auf, dass jedes Ereignis spezifische Merkmale und Eigenschaften besitzt. Diese können kategorisiert und gemessen und als eine Art Fingerabdruck des Fehlerereignisses betrachtet werden. Im Folgenden werden beispielhaft Eigenschaften aufgeführt, wie sie seit Jahren in den Branchen Automotive und Maschinenbau verwendet werden. Diese Beispiele haben keinen Anspruch auf Vollständigkeit, je nach Branche und System können mehr oder weniger Kriterien berücksichtigt werden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Die Kritikalität beschreibt die Schwere eines Ereignisses im Zusammenhang mit der Wahrscheinlichkeit oder Häufigkeit seines Auftretens. Je höher der Wert, umso wahrscheinlicher ist das Ereignis, desto schwerwiegender sind seine Auswirkungen und desto schneller wird die betroffene Funktion im System abgebrochen.

Die Identität beschreibt, wie gut Lokalisierung und eindeutige Identifizierung bei einem Ausfall oder Ereignis vorgenommen werden können. Je höher der Wert, desto besser lässt sich das Ereignis entdecken und finden.

Die Reparabilität beschreibt die Wiederherstellbarkeit nach einem Ausfall oder Ereignis im Zusammenhang mit Aufwand, Kosten und Dauer für die Ereignisbehebung. Je höher der Wert, desto leichter lässt sich ein Ereignis beheben.

Die Prädiktabilität beschreibt die Voraussagbarkeit eines Ereignisses im Zusammenhang mit seiner Ausfallmessbarkeit, dem Aufwand der Analyse und der Erkennbarkeit von Mustern. Je höher der Wert, desto besser lässt sich ein Ereignis voraussagen.

Die Präventabilität beschreibt die Vermeidbarkeit eines Ereignisses im Zusammenhang mit seiner Austauschbarkeit, seiner Verbesserbarkeit und dem Aufwand für die Vermeidung. Je höher der Wert, desto besser lässt sich ein Ereignis vermeiden.

Die Intensität ist der Durchschnitt aller bisherigen Merkmale und erlaubt die Gewichtung des Ereignisses im Vergleich zu anderen Ereignissen.

Die Vitalität gibt an, in welchem Lebensabschnitt des technischen Systems ein Ereignis eintreten kann. Sie stellt im Vergleich zu den anderen Merkmalen keinen einzelnen Wert dar, sondern einen Zeitbereich.

Vergleicht man die Merkmale und Eigenschaften verschiedener Ereignisse miteinander, stellt man fest, dass sich für jedes Ereignis ein typischer Fingerabdruck bildet. Dieser Fingerabdruck gibt einen ersten Hinweis auf mögliche Instandhaltungsstrategien für das entsprechende Ereignis. Ähnliche Fingerabdrücke fordern dieselben Instandhaltungsstrategien.

Die bekanntesten Instandhaltungsstrategien

Eine Instandhaltungsstrategie beschreibt die Vorgehensweise, wie Produktivität und Lebenserwartung einer Anlage aufrechterhalten oder sogar erhöht werden. Es gibt eine Vielzahl unterschiedlicher Strategien, die sich unterscheiden in ihrem Durchführungszeitpunkt relativ zu einem Ereignis und in den einzelnen Aufgaben innerhalb der Strategiedurchführung. Die folgende Übersicht zeigt die bekanntesten Instandhaltungsstrategien.

Die ausfallende Instandhaltung oder Reactive Maintenance ist eine korrektive Instandhaltung, die ohne Aufschub nach der Fehlererkennung ausgeführt wird, um unannehmbare Folgen zu vermeiden. Alle Ereignisse, die sich gut identifizieren und lokalisieren lassen, sind für die ausfallende Instandhaltung sehr gut geeignet. Dagegen müssen Ereignisse, die keine oder kaum eine Funktionsauswirkungen haben und sehr unwahrscheinlich eintreten, für diese Strategie nicht berücksichtigt werden. Sicherheitsrelevante Fehler sollten durch andere Instandhaltungsstrategien behoben werden.

Vorteile dieser Instandhaltungsstrategie sind die maximale Ausnutzung der Lebensdauer der Komponenten, der geringe Planungsaufwand, die einfache Umsetzbarkeit und die Einbeziehung der Anwender in die Instandhaltungsregelung. Die Zeitdauer wird nur durch die Reparatur selbst geprägt. Jedoch müssen ungeplante, sofort durchzuführende Tätigkeiten, das Risiko auf längere Stillstandszeiten und die geringere Anlagenverfügbarkeit als Nachteile eingeplant werden.

Die aufschiebende Instandhaltung oder Active Maintenance ist eine korrektive Instandhaltung, die nicht unmittelbar nach der Fehlererkennung ausgeführt, sondern nach vorgegebenen Instandhaltungsregeln zurückgestellt wird. Sie ist eine Nebenform der ausfallenden Instandhaltung mit der Besonderheit, dass der Zeitpunkt der Reparatur geplant wird. Alle Fehlerereignisse, die gut identifiziert und lokalisiert werden können, sind gut geeignet. Sicherheitsrelevante Fehler und Einschränkungen der Funktion müssen durch andere Instandhaltungsstrategien behoben werden. Jedoch sind schnell und sofort behebbare Fehler für diese Strategie nicht geeignet.

Diese Instandhaltungsstrategie hat dieselben Vor- und Nachteile wie die ausfallende Instandhaltung. Zusätzlich sollten als Nachteile jedoch noch der zusätzliche Planungsaufwand und das Risiko von Folgeschäden genannt werden.

Die vorausbestimmende Instandhaltung oder Preventive Maintenance ist eine präventive Instandhaltung, die nach einem definierten Zeitplan oder nach einer festgelegten Zahl von Nutzungseinheiten durchgeführt wird, jedoch ohne vorherige Zustandsermittlung. Hierbei handelt es sich um eine klassische Wartung. Alle Ereignisse, die wenig Kosten verursachen und bei denen die Wartung im Verhältnis zu einer möglichen Reparatur nicht zu lange dauert, sind gut geeignet für diese Strategie. Nicht geeignet sind schwer reparierbare Fehlerereignisse und unwahrscheinliche Ereignisse ohne Auswirkungen auf die funktionale Sicherheit und Funktion.

Vorteile dieser Strategie sind Planbarkeit der Arbeiten (Termin und Dauer), genaue Kenntnisse der Abläufe und der benötigten Ersatzteile, hohe Materialverfügbarkeit, hohe Arbeitsqualität, exakte Kalkulierbarkeit, Reduktion ungeplanter Ausfälle und erhöhte Lebensdauer der Komponenten. Nachteilig wirken dagegen erhöhte Kosten und zusätzliche Arbeitsstunden für Planung und Durchführung der Wartung und fehlende Kenntnis über das reale Ausfallverhalten der Anlage.

Die voraussagende Instandhaltung oder Predictive Maintenance ist eine präventive Instandhaltung, die auf Basis einer Prognose durchgeführt wird. Grundlagen dieser Vorhersage sind bekannte Eigenschaften oder Erfahrungen aus Analysen der Vergangenheit oder das Eintreten von wichtigen Parametern, welche den Abbau eines Elements kennzeichnen. Mit dieser Instandhaltungsstrategie wird ein zukünftiges Fehlverhalten eines Systems vermieden. Die Komponenten eines potenziellen Fehlerereignisses werden ausgetauscht oder die Auswirkungen der Fehlerursachen werden reduziert, bevor das Ereignis eintritt. Wichtig hierfür ist, dass das Ereignis einen gewissen Grad der Vorhersagbarkeit haben muss.

Die Vorteile sind Planbarkeit der Arbeiten, Bekanntheit der Abläufe und benötigten Ersatzteile, hohe Materialverfügbarkeit, hohe Arbeitsqualität, exakte Kalkulierbarkeit, erhöhte Anlagenverfügbarkeit, weniger ungeplante Ausfälle und längere Lebensdauer der Komponenten. Nachteile sind dagegen die Notwendigkeiten von ausreichendem Vorlauf zur Planung von intelligenten Algorithmen, von ausreichend vorhandenen Datensätzen zur Mustererkennung. Weitere Nachteile sind höherer Aufwand und höhere Kosten durch Planung und Durchführung vermehrter Wartungsarbeiten, hohe Anforderungen an Personalqualifikation für die Entwicklung der Algorithmen und notwendige Kenntnis über das Ausfallverhalten der Anlage. Ferner kann diese Strategie erst weit nach Produktionsbeginn eingesetzt werden, da benötigte Erfahrungen zunächst gesammelt werden müssen.

Aufgrund der Vielzahl der Nachteile sind sowohl unwahrscheinliche und seltene Ereignisse mit geringen Auswirkungen auf die funktionale Sicherheit und Funktion als auch schwer reparierbare und kostenintensive Ereignisse für eine voraussagende Instandhaltung nicht geeignet.

Die zustandsbestimmende Instandhaltung oder Condition Based Maintenance ist eine zustandsorientierte Instandhaltung. Mögliche Instandhaltungsmaßnahmen resultieren aus Beurteilungen des physischen Zustands und gegebenenfalls weiterer Analysen. Sie ist eine vorhersagende, wissensbasierte Strategie. Alle Ereignisse mit einer gewissen Vorhersagbarkeit und guter Lokalisierung sind geeignet. Vorteile und Nachteile sind identisch zur voraussagenden Instandhaltung.

Die verdrängende Instandhaltung ist eine Strategie, bei der ein erkanntes oder vorhandenes Ereignis ignoriert wird. Sie ist keine echte Instandhaltung, sondern eher eine Lösung für den Umgang mit speziellen Fehlerereignissen. Mit dieser Instandhaltungsstrategie wird ein bekanntes oder unbekanntes Fehlverhalten eines Systems nicht behoben. Diese Strategie ist nur sinnvoll bei Ereignissen mit keiner oder geringer Funktionsauswirkung.

Vorteilhaft sind die nicht anfallenden Kosten. Nachteilig ist jedoch, dass mindestens Funktionseinschränkungen der Anlage zu erwarten sind, gegebenenfalls sogar ein erhöhtes Ausfallrisiko besteht, weil eben keine Reparatur durchgeführt wird.

Bildergalerie

Die passende Instandhaltungsstrategie für jedes Ereignis

Die effektivste Instandhaltung ist erreicht, wenn die angewendete Instandhaltungsstrategie zum anliegenden Instandhaltungsereignis passt. Daher ist die entscheidende Aufgabe, zu einem Ereignis die nutzbare Instandhaltungsstrategie zuzuordnen. Wie kann das gelingen?

Eine einfache und sehr erfolgreiche Methodik ist das Event-Fingerprint-Masking. Bei dieser Methode werden die Eigenschaften der Instandhaltungsstrategien mit den Fingerabdrücken technischer Ereignisse verglichen.

Die voraussagende Instandhaltung zum Beispiel ist zunächst einmal prinzipiell besonders geeignet für Ereignisse mit einer hohen Prädiktabilität. Da diese Instandhaltungsstrategie aber auch gravierende – insbesondere wirtschaftliche – Nachteile hat, sollten zusätzliche spezifische Merkmale betrachtet werden.

Bei gut identifizierbaren oder leicht reparierbaren Ereignissen kann man vielleicht besser abwarten, bis das Ereignis eintritt, und sich dann kümmern. Bei leicht vermeidbaren Ereignissen ist es wahrscheinlich auch besser, das Eintreten des Ereignisses zu vermeiden, anstatt frühzeitig z. B. komplette Komponenten auszutauschen.

Weist der Fingerabdruck des Ereignisses neben der hohen Prädiktabilität aber eine niedrige Präventabilität, eine niedrige Identität und eine niedrige Reparabilität auf, so kann die voraussagende Instandhaltung eine gute Wahl sein.

Durch diesen Ansatz entstehen für jede einzelne Strategie spezielle Maskierungen, die gut für die Analyse und zur Strategieentscheidung jedes einzelnen Ereignisses genutzt werden können.

Eine Instandhaltungsstrategie ist dann für ein Ereignis gut anwendbar, wenn der typische Fingerabdruck des Ereignisses in die Maske der Instandhaltungsstrategie passt.

Beispiel des Event-Fingerprint-Masking für ein beispielhaftes Ereignis
Beispiel des Event-Fingerprint-Masking für ein beispielhaftes Ereignis
(Bild: Synostik)

Die Grafik zeigt als Beispiel die Masken der oben beschriebenen Instandhaltungsstrategien, zusätzlich einen beispielhaften Fingerabdruck eines Ereignisses und sein Passen in die jeweiligen Masken. In diesem Beispiel ist zu erkennen, dass das gewählte Ereignis sehr gut sowohl in die Maske der ausfallenden als auch in die der verdrängenden Instandhaltung passt. Wogegen die anderen Instandhaltungsstrategien eine eher schlechte Wahl wären. Diese Methodik ist für jedes einzelne Ereignis eines technischen Systems anzuwenden. Anschließend kann festgelegt werden, welche Instandhaltungsstrategien für welche Ereignisse umzusetzen sind.

Optimierung der Instandhaltungsstrategien durch individuelle Ereignisanalyse

Eine Vielzahl von Ereignissen kann Funktionalität und Produktivität eines technischen Systems stören. Die richtige Instandhaltungsstrategie für jedes Ereignis ist entscheidend, um die Produktivität einer Maschine oder Anlage hoch und gleichzeitig Instandhaltungskosten niedrig zu halten.

Da jedes der Ereignisse seinen individuellen Fingerabdruck hat, kann man mit dessen Hilfe die potenziell möglichen Instandhaltungsstrategien ableiten. Dafür sind spezielle diagnostische Methoden, Kataloge und Verfahren unerlässlich.

Nutzt die Industrie die bereits vorliegenden Erfahrungen zu den Ereignissen aus anderen Branchen, können perfekt angepasste Diagnosestrategien einen wirtschaftlichen Vorteil in der Instandhaltung bringen.

Dieser Artikel stammt von unserem Partnerportal Industry of Things.

* Heino Brose ist Geschäftsführer von Synostik.

(ID:49681419)