Navigation überspringen

Predictive Analytics per Mausklick: KNIME im Härtetest

Unser Auftrag lautete, in einem Proof of Concept herauszufinden, ob KNIME diesen Ansprüchen gerecht werden kann.

Mit mehreren hundert Filialen in Deutschland verfügt der ITGAIN-Kunde über ein großes Netz an Unternehmens- wie Privatkunden. Entsprechend umfangreich ist die dazugehörige Datensammlung. Analytics kam bisher vor allem zum Einsatz, um die passenden Modelle für die Ratings und Scorings im Kreditbereich zu erstellen. Dazu nutzt der Kunde ein eigens entwickeltes Tool, mit dem nur ein paar Experten im Unternehmen arbeiten konnten. Wartung und Handhabung sind entsprechend aufwändig. Außerdem arbeiten in der Bank und der gesamten Branche nur wenige Menschen, die Know-how im Bankengeschäft mit Programmierfähigkeiten in sich vereinen – ein Nachteil, wenn man künftig Analytics agil im Endkundengeschäft einsetzen will. „Daher sollte eine neue Lösung her, die die Stärken von Data-Mining und Machine Learning für Mitarbeiter ohne Programmierfähigkeiten aus verschiedenen Fachbereichen nutzbar macht“, erklärt Thilo Boehnke. Er leitete den Proof of Concept für ITGAIN.  

Die Wahl des Kunden fiel auf das Open-Source-Tool KNIME, weil es sowohl das explorative Arbeiten mit Daten als auch Machine Learning beherrscht und dazu eine einfache grafische Bedienoberfläche bietet. „Mit ihrer Hilfe kann zum Beispiel ein Kundenberater relativ schnell ein Cluster von Privatkunden zwischen 35 und 40 Jahren zusammenklicken, die in München leben und seit mehr als zwei Jahren ein Girokonto der Bank nutzen", erklärt Thilo Boehnke. Dieses Cluster kann er dann entsprechend für Verhaltensprognosen nutzen. Ein riesen Vorteil im Endkundengeschäft.

Vorsicht, Regularien!

Doch wie so oft brauchte es den Blick fürs große Ganze, um zu verstehen, ob die Software die richtige Wahl ist. "Was nützt ein Tool, das ein Problem lösen kann, aber nicht in der bestehenden IT-Umgebung funktioniert?", merkt Thilo Boehnke an. Zur Umgebung gehören branchenübliche Restriktionen. Beim Rating und Scoring sind Banken an klare Richtlinien und Nachweispflichten gebunden, die nur bestimmte Analyse-Modelle zulassen. Für diese wiederum wird voraussichtlich auf Scriptsprachen wie Python und R zurückgegriffen aber auch eine Kombination mit KNIME wäre realisierbar. Eine endgültige Entscheidung steht noch aus.

Ein weiterer Punkt: Per KNIME mussten verschiedene Analytics-Modelle von einer Abteilung in die nächste übertragbar sein. Wie wichtig das war, betont Thilo Boehnke: „Die logistische Regression etwa, die für den Finanzsektor wichtig ist, musste KNIME beherrschen, sonst wäre das Tool nutzlos gewesen. Was es auch tat." Außerdem sollten die Daten aus einer schnellen Exasol-Datenbank gezogen werden. Also galt es ebenfalls zu testen, ob alle Komponenten miteinander harmonieren.

250 Prüfkriterien
 

Dann hieß es: Testen, testen, testen. Im praktischen Teil, dem eigentlichen Proof of Concept, wurde KNIME auf Herz und Nieren geprüft. Insgesamt bewerteten die ITGAIN-Experten 250 Kriterien, wie Performance, Support, Visualisierung.

„Aus unserer Sicht deckt KNIME die Anforderungen mit einigen Einschränkungen ab und lässt sich mit der angedachten Infrastruktur zusammenführen.“ Die Mitarbeiter, etwa in der Endkundenbetreuung, könnten unkompliziert Cluster oder passende Vorhersagen an das Callcenter weitergeben, wenn ein Kunde mit einer hohen Kündigungswahrscheinlichkeit am Telefon ist. Die regulierten Rating-Prozesse würden wie bisher über die Experten laufen.

Auch die Exasol-Datenbank kann genutzt werden. Für den Kunden bedeutet das, dem Einsatz von KNIME steht technisch gesehen nichts im Wege. Viele Mitarbeiter dürfte das freuen, da sie künftig ihre Kunden mit ein paar Klicks ein ganzes Stück besser verstehen und somit einen beidseitigen Mehrwert generieren können.