Business-Lösungen

Data Mining in der Praxis

Bessere Daten – bessere Ergebnisse

In den Daten von gestern die Antworten von morgen finden – Predictive Analytics ist ein Thema, das in Analytics-Projekten mehr und mehr an Bedeutung gewinnt. Mit modernen Data Mining-Werkzeugen lässt sich aus Datenbeständen mehr herausholen als nur die Analyse abgeschlossener Vorgänge. Häufig beginnen solche Analysen mit einer experimentellen Phase, bei der man erst einmal schaut, was in den vorhandenen Daten „so drinsteckt“.

Die Software-Architekten der PROFI AG führen solche Analysen für ihre Kunden durch. Beispiele aus der jüngeren Vergangenheit sind ein Proof-of-Concept für einen Dienstleister im Bereich der Flugzeugwartung (Bestimmung der Lebenserwartung von Ersatzteilen) sowie eine Studie für das Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) zum Thema Brückenerhaltungsmanagement. In diesem Fall bewirbt sich die PROFI gerade um eine weiter gehende Förderung zur Realisierung einer Pilotanwendung.

Bei beiden Untersuchungen ging es um die Frage, inwieweit die Analyse von Bestandsdaten Einflussfaktoren für das Versagen von Bauteilen aufdecken kann. Die Antwort lautet in diesem Bereich immer wieder: im Prinzip ja – aber reichen Menge und Qualität der vorhandenen Daten für eine verlässliche Prognose aus?

Die Qualität der Daten lässt sich mit modernen Data Mining-Werkzeugen prüfen und verbessern, zum Beispiel durch Eliminierung von Ausreißern in Messwerten oder Ergänzung fehlender Werte durch Interpolation. Die für eine Vorhersage erforderliche Datenmenge müssen die verfügbaren Datenquellen liefern. Helfen können in beiden Fällen auch Daten, die durch Textmining-Verfahren aus unstrukturierten Quellen gewonnen werden und dadurch die Datenbasis vergrößern oder Qualitätslücken schließen.

In den vorliegenden Beispielen wurden Daten aus verschiedenen Quellen zusammengeführt, Schlüsselwerte vereinheitlicht, Werte kategorisiert und letztendlich mit verschiedenen Regressionsmodellen, Entscheidungsbäumen und neuronalen Netzen verarbeitet. Ziel war es, die vorher definierte Fragestellung zu beantworten: Wie lange hält das Bauteil, bevor ein Defekt auftritt?

Die Erkenntnisse aus der Studie zum Brückenerhaltungsmanagement zeigen: Der Ansatz ist es wert, in einem Pilotprojekt vertieft und in der Praxis erprobt zu werden. Auch hier gilt: Je mehr Daten für eine Analyse bereitgestellt werden können, desto genauer wird das Vorhersagemodell. Es ist also in jedem Fall sinnvoll, ein Pilotprojekt entsprechend breit aufzusetzen, um keine wertvollen Erkenntnisse zu verpassen.

Aus der Machbarkeitsstudie für das BMVI: Von der Problemdefinition über die Modellierungsphase zur Anwendungsphase
Stefan Held,
Software-Architekt der PROFI AG