Unterschied zwischen Data Mining und Predictive Analytics

Das Hauptunterschied zwischen Data Mining und Predictive Analytics ist, dass die Beim Data Mining werden verborgene Muster von Daten mithilfe von Algorithmen und Mining-Tools identifiziert. Die Vorhersageanalyse ist das Verfahren, bei dem Geschäftswissen auf die ermittelten Muster angewendet wird, um Vorhersagen zu treffen.

Beim Data Mining werden die Muster in einem großen Dataset ermittelt. Es extrahiert neue Muster und Beziehungen zwischen Datenentitäten. Die Ausgabe von Data Mining ist ein Muster, das eine zeitabhängige Verteilung bildet. Predictive Analytics ist dagegen der Prozess, bei dem Geschäftswissen auf ermittelte Muster in einem Datensatz angewendet wird, um Trends und Verhalten vorherzusagen. Diese Muster werden durch Data Mining oder andere Verfahren entdeckt. Geschäftsanalysten und Domain-Experten analysieren und interpretieren sie, um aussagekräftige geschäftliche Erkenntnisse zu gewinnen. 

Wichtige Bereiche

1. Was ist Data Mining?
     - Definition, Verwendung
2. Was ist Predictive Analytics?
     - Definition, Verwendung
3. Unterschied zwischen Data Mining und Predictive Analytics
      - Vergleich der wichtigsten Unterschiede

Schlüsselbegriffe

Data Mining, Predictive Analytics

Was ist Data Mining?

Data Mining bezieht sich auf das Erkennen von Mustern in einem großen Datensatz. Es beinhaltet das Extrahieren von Informationen aus einem Datensatz und das Umwandeln der Informationen in eine nachvollziehbare Struktur zur weiteren Verwendung. Es wird in vielen Bereichen wie Mathematik, Kybernetik, Marketing usw. eingesetzt.

Abbildung 1: Datensatz

Data Mining ist mit verschiedenen Aufgaben wie Datenintegration, Datentransformation, Musterauswertung und Visualisierung verbunden. Daten stammen aus mehreren Quellen. Alle Daten werden an einem einzigen Ort namens Data Warehouse integriert und gespeichert. Zweitens werden die Daten vorverarbeitet, um sie für das Data Mining geeignet zu machen. Anschließend werden die Muster mithilfe von Algorithmen wie Clustering, Regression usw. erkannt. Anschließend werden diese Muster mithilfe von Graphen bewertet und visualisiert.

Darüber hinaus gibt es eine Art von Data Mining, das als Web Mining bezeichnet wird. Hierbei werden Informationen mithilfe herkömmlicher Data-Mining-Methoden und -Techniken über das Web gesammelt. Es hilft, Faktoren wie die Effektivität einer Website und das Kundenverhalten zu verstehen. Insgesamt bietet Data Mining die Möglichkeit, verborgene Muster in Daten aufzudecken, sodass diese für Vorhersagen und Geschäftsentscheidungen verwendet werden können.

Was ist Predictive Analytics?

Predictive Analytics analysiert die aktuellen und historischen Fakten, um Vorhersagen über zukünftige oder unbekannte Ereignisse zu treffen. Es verwendet verschiedene statistische Techniken wie Data Mining, Predictive Modeling und Machine Learning.

Abbildung 2: Predictive Analytics-Prozess

Der Prozess der vorausschauenden Analyse umfasst die folgenden Aktivitäten.

  1. Projekt definieren - Definieren Sie Projektergebnisse, Umfang, Geschäftsziele und identifizieren Sie den zu verwendenden Datensatz.
  2. Datenerfassung - Sammeln von Daten aus mehreren Quellen.
  3. Datenanalyse - Prozess der Überprüfung und Modellierung von Daten, um nützliche Informationen zu ermitteln.
  4. Statistische Analyse - Validieren Sie Annahmen, Hypothesen und testen Sie sie mit statistischen Modellen.
  5. Modellierung - Erstellen Sie genaue Vorhersagemodelle für die Entscheidungsfindung.
  6. Bereitstellung - Stellen Sie die Analyseergebnisse für den täglichen Entscheidungsprozess bereit, um Ergebnisse, Berichte und Ausgaben zu erhalten.
  7. Modellüberwachung - Verwalten und Überwachen der Modellleistung, um sicherzustellen, dass das Modell die erwarteten Ergebnisse liefert.

Predictive Analytics wird in vielen Bereichen eingesetzt. Es hilft Unternehmen, Muster aus historischen und Transaktionsdaten zu analysieren, um Risiken und Chancen zu erkennen. Nehmen Sie zum Beispiel eine Kreditbewertung an. Die Kredithistorie, der Kreditantrag und die Kundendaten des Kunden werden analysiert und verarbeitet, um zu entscheiden, ob dieser Kunde die Kreditzahlung rechtzeitig bezahlt. Predictive Analytics wird darüber hinaus in Bereichen wie Marketing, Finanzen, Versicherungen, Einzelhandel, Telekommunikation, Gesundheitswesen, Social Networking usw. eingesetzt.

Unterschied zwischen Data Mining und Predictive Analytics

Definition

Beim Data Mining werden Muster in großen Datensätzen mithilfe von Methoden des maschinellen Lernens, von Statistiken und von Datenbanksystemen entdeckt. Predictive Analytics ist das Gebiet der Statistik, bei dem Informationen aus Daten extrahiert und zur Vorhersage von Trends und Verhaltensmustern verwendet werden. Dies erklärt den grundlegenden Unterschied zwischen Data Mining und Predictive Analytics. 

Funktionalität

Data Mining wendet Algorithmen wie Regression und Klassifizierung der gesammelten Daten an, um verborgene Muster zu entdecken. Predictive Analytics wendet jedoch betriebswirtschaftliches Wissen auf ermittelte Muster an, um valide Vorhersagen zu erhalten.

Verwendungszweck

Es gibt einen weiteren Unterschied zwischen Data Mining und Predictive Analytics, basierend auf ihrer Verwendung. Data Mining hilft dabei, die gesammelten Daten besser zu verstehen, Predictive Analytics hilft jedoch, Vorhersagen über zukünftige oder unbekannte Ereignisse zu treffen.

Beteiligte Berufe

Obwohl Data Mining von Statistikern und Ingenieuren durchgeführt wird, werden prädiktive Analysen von Business-Analysten und anderen Domain-Experten durchgeführt.

Fazit

Der Unterschied zwischen Data Mining und Predictive Analytics besteht darin, dass Data Mining ein Verfahren ist, bei dem die verborgenen Muster von Daten mithilfe von Algorithmen und Mining-Tools identifiziert werden, während Predictive Analytics das Verfahren ist, bei dem Geschäftswissen auf die entdeckten Muster angewendet wird, um Vorhersagen zu treffen.

Referenz:

1. „Was ist Data Mining? - Definition von WhatIs.com. ”SearchSQLServer, hier verfügbar.
2. „Predictive Analytics“. Wikipedia, Wikimedia Foundation, 26. August 2018, hier verfügbar.