Data Mining
Das Data Mining ist ein Schritt in der Verfahrenstechnik zur automatisierten Wissensfindung. Durch den erhöhten Informationsfluss des digitalen Zeitalters wurden Tools und Systeme entwickelt, um das Ablegen und Selektieren von Informationen zu vereinfachen. Die Analyse der Daten wird als Data Mining bezeichnet.
In der Praxis wird das Data Mining jedoch oft mit dem gesamten Prozess der Wissensgewinnung aus Daten, auch „Knowledge Discovery in Databases (kurz KDD)“ genannt, gleich gesetzt. Richtigerweise sollte das Data Mining als Anwendung von Algorithmen verstanden werden mit der Zielsetzung, Muster aus Daten zu extrahieren.
Definitionen
„Unter Data Mining versteht man die Anwendung von Methoden und Algorithmen zur möglichst automatischen Extraktion empirischer Zusammenhänge zwischen Planungsobjekten, deren Daten in einer hierfür aufgebauten Datenbasis bereitgestellt werden.“ (Gabler Wirtschaftslexikon)
„Erforschung und Analyse großer Datenmengen mit automatischen oder halbautomatischen Werkzeugen, um bedeutungsvolle Muster und Regeln aufzufinden“ (Berry und Linoff)
„Methodik zur Problemlösung um logische oder mathematische, zum Teil komplexe Beschreibungen von Mustern und Regelmäßigkeiten in Datensätzen zu entdecken“ (Decker und Focardy)
Begriffsdefinition
Die Bezeichnung Data Mining stammt aus dem Bereich der Statistik und wird zur Bestätigung vorformulierter Hypothesen verwendet. Noch heute beruhen viele Data Mining-Methoden auf statistischen Verfahren.
Funktionsweise
Um die Wissensgewinnung aus einer großen Datenmenge flexibel gestalten zu können, müssen die Daten zuerst für eine Analyse aufbereitet werden. Zur Aufbereitung werden Verfahren eingesetzt, die u.a. fehlende Werte in Datensätzen ergänzen oder stark abweichende Werte entfernen. Anschließend werden die Daten umformatiert. Dazu gehört die Reduktion des Datenbestandes auf eine relevante Teilmenge. Nach der Datenvorbereitung erfolgt die Auswahl der Analysefunktion. Durch Extraktion, Filterung und Aggregation der gespeicherten Daten können produktions-, vertriebs- oder marketingrelevante Erkenntnisse gewonnen und umgesetzt werden. Die tatsächliche Durchführung der Analyse bezeichnet man als Data Mining. Mittels Data Mining können aus den Daten bestimmte Rückschlüsse und Zusammenhänge erkannt werden. So können zum Beispiel das Reiseverhalten einer Bevölkerung oder das Kaufverhalten einer bestimmten Klientel bestimmt werden.