at banner

Daten, Korrelation, Information und Patterns „Die Sterne machen gewogen, entscheiden darfst du“

Welche Zusammenhänge gibt es wohl zwischen diesem Leitspruch der Astrologie und einer etwas jüngeren IT-Disziplin, neue Informationen aus vorhandenen Daten zu gewinnen?
Der Astrologe muss durch Verknüpfen vieler Einzelinformationen Muster erkennen, deren Bedeutung er durch die Projektion auf die eigene Erfahrungswelt ermessen kann. Er muss im Stande sein, vernetzt und in Analogien zu denken. Durch dieses Können (seine Skills), durch die Anwendung der Methode (Verknüpfen, Gewichten) und der Werkzeuge (Tabellen, Regeln) entstehen vorher nicht erahnbare Aussagen, deren Treffsicherheit für uns Laien kaum begreifbar ist. Wie wir angesichts der Aussagen handeln werden, entscheiden wir unter Einbeziehung unserer Lebenserfahrungen.


Betrachtet man die wichtigen Aspekte der Gewinnung neuer Informationen aus IT-Daten, so erkennt man schnell die Analogie zur Kunst der Sterndeutung. Die Daten sind heute meist in ausreichender Menge vorhanden. Nutzbringende neue Aussagen entstehen aber häufig erst durch Verknüpfung und durch das Erkennen vorher definierter Muster. Die Verknüpfung verschiedener Datenfelder erfolgt nach vorgegebenen Regeln und wird in der IT als Korrelation bezeichnet. Die Definition der später zu erkennenden Muster ist nun die Kernexpertise eines Datenanalytikers, während die nachfolgende Erkennung (Pattern Recognition) heute eine etablierte Fähigkeit im Softwarebereich darstellt. Die Entscheidung, was aufgrund erkannter Muster zu tun ist, wird auch in der Informationstechnologie von Erfahrung geleitet werden.

 
Einsatz von Daten-Analyseverfahren

Am Beispiel eines Telekommunikationsbetreibers wird
ersichtlich, wie ein schwieriges Infrastrukturproblem im Kabelnetz gelöst werden kann: Wenn es gelingt, ein Datenmuster mit einer Aussagekraft wie „Leitungsabschnitt ist mit 70% Wahrscheinlichkeit von wiederholten Signalstörungen mit Datenverlust betroffen“ zu beschreiben und zu erkennen, dann könnte ein Wartungsteam eine gezielte Entstörung einleiten, noch bevor es zu massiven Beschwerden der betroffenen Kunden und zur Verletzung von Service Level Agreements kommt.


Genau solche Aussagen werden aber durch die Korrelation von historischen Störungsdaten, Leitungsführungsdaten, elektrischen Messwerten und Signaldaten möglich, wenn man diese Daten unter Einbeziehung einer Zeitreihe als Patterns zu definieren versteht und systematisch nach diesen Patterns sucht. Für die Messung der Übertragungsqualität einer Leitung gibt es spezielle Systemlösungen und Geräte. Die Korrelations-Analyseverfahren haben aber gegenüber dedizierten Messeinrichtungen signifikante Kostenvorteile und sind unvergleichlich flexibler in der Anwendung.

 

Beispiele aus der Praxis

Unisys setzt die Disziplin der Korrelation und Pattern-Erkennung mit großem Erfolg auch im öffentlichen Bereich, im Gesundheitswesen und bei Finanzdienstleistern ein. So konnten zum Beispiel für die Burgenländische Gebietskrankenkasse wertvolle Erkenntnisse über Verhaltensmuster der Ärzte bei Generikaverschreibungen geliefert werden, Erkenntnisse die direkt in die Maßnahmen- und Versorgungsplanung einfließen.
In einem anderen Fall half Unisys einer führenden Bank, durch Analyse der Kreditkartentransaktionen einen Entscheidungsbaum zu generieren, der dann die Grundlage für ein zielgruppenorientiertes Marketingprogramm bildete.