Bücherregal symbolisiert Glossar

YAVEON  »  Glossar  »

Data Mining

Was ist Data Mining?

Data Mining ist der Prozess, bei dem computergestützte, statistische Verfahren systematisch genutzt werden, um Muster, Zusammenhänge und Trends in Big Data, also großen Datenbeständen zu erkennen. Ziel ist es, anhand dieser Zusammenhänge nötige Handlungen zu erkennen und umzusetzen.

Woher stammt der Begriff Data Mining?

Data Mining, im Deutschen Daten-Abbau, leitet sich vom Bergbau ab. Denn so, wie beim Bergbau Bodenschätze abgebaut werden, fördert Data Mining Informationen aus Datenmengen zutage mit dem Ziel, wertvolle Schätze bzw. Erkenntnisse zu entdecken.

Wie funktioniert Data Mining?

Data Mining ist interdisziplinär angelegt und greift auf Erkenntnisse aus den Bereichen IT, Mathematik und Statistik zurück und nutzt Verfahren der Künstlichen Intelligenz sowie das Machine Learning, auf Deutsch Maschinelles Lernen. Als Teil des Knowledge-Discovery-in-Databases-Prozesses läuft Data Mining in folgenden Schritten ab:

  • Fokussieren: Im ersten Schritt werden Daten erhoben und bereits vorhandenes Wissen definiert – die Datenaufbereitung.
  • Vorbereiten: Es folgt im zweiten Schritt die Datenbereinigung.
  • Transformieren: Nun werden die Daten in ein Format transformiert, das für die Analyse geeignet ist.
  • Data Mining: Im vierten Schritt erfolgt das eigentliche Data Mining, die Analyse wird durchgeführt.
  • Evaluieren: Identifizierte sequenzielle Muster und Trends werden im letzten Schritt untersucht.
FOKUSSIERENTRANSFORMIERENNun werden die Daten in ein Format transformiert, das für die Analyse geeignet ist.EVALUIERENIdentifizierte sequenzielle Muster und Trends werden im letzten Schritt untersucht.VORBEREITENEs folgt im zweiten Schritt die Datenbereinigung.DATA MININGIm vierten Schritt erfolgt das eigentliche Data Mining, die Analyse wird durchgeführt.12345Ablauf des Data-Mining Prozesses

Welche Vorteile hat Data Mining?

  • Zielgerichtete Kundenorientierung: Die Analyse der Daten ermöglicht es, Wünsche von Kunden und sich daraus ergebende Prognosen zielgerichtet zu erstellen.
  • Neue Informationen erschließen: Weil mit Data Mining sehr große Datenmengen erschlossen werden, können neuen Erkenntnisse zutage kommen.
  • Bessere Entscheidungen: Die detaillierten und genauen Auswertungen dank Data Mining dienen als Grundlage für datenbasierte Entscheidungen.
  • Der Konkurrenz voraus: Erkenntnisse, die aus Data Mining entstehen, können dazu dienen, Trends zu erkennen und entsprechend frühzeitig Maßnahmen einzuleiten. Das kann Marktvorteile erzeugen.
  • Zeitersparnis: Data Mining ermöglicht es, Bilder und Texte maschinell zu verarbeiten und somit Aufwand zu reduzieren.
  • Genauere Prognosen: Aussagen, die auf Data Mining basieren, sind sehr ausführlich sowie präzise und damit die optimale Basis, um eine Prädikation, also Vorhersage, genauer zu treffen.
  • Bessere Geschäftsprozesse: Data Mining zeigt Optimierungspotenziale und bevorstehende Trends auf. Daraus lassen sich Schlüsse ziehen, wie die eigenen Geschäftsprozesse verbessert werden können.

Wo wird Data Mining eingesetzt?

Data Mining kommt hauptsächlich in den Bereichen Wirtschaft und Forschung zum Einsatz. Dazu zählen:

  • Vertrieb und Marketing
  • Produktentwicklung
  • Gesundheitswesen
  • Bildungswesen

Zusammenhängen auf einen Blick erkennen

Muster und Trends einfacher erkennen? Schaffen Sie mit Microsoft Power BI - die ideale Basis für ergebnisorientiertes Data Mining mit Mehrwert. Testen Sie es selbst!

Vorschaubild Power BI Whitepaper

Welche Data Mining Methoden bzw. Data Mining Verfahren gibt es?

  • Klassifikation

    Bei der Klassifikation dienen Klassifikationsmerkmale als Ausgangspunkt, um sequenzielle Muster zu erkennen. Zum Beispiel lassen sich so die Affinität der Kunden zu bestimmten Produkten erkennen und es lässt sich beispielsweise auswerten, ob Kunden eher auf digitale oder manuelle Lösungen setzen.

  • Gruppierung

    Die Gruppierung umfasst die Bereiche Segmentierung und Clustering. Es geht darum, Gruppen und Segmente in Daten auszumachen. Diese Methode kommt beispielsweise im Marketing zum Einsatz, indem Marketingmaßnahmen auf Basis einer vorher durchgeführten Kundensegmentierung abgeleitet werden. Kunden, die beispielsweise in die Kategorie „Pharma“ fallen, bekommen die entsprechende Werbung angezeigt.

  • Was ist der Unterschied einer Clusteranalyse und dem Klassifikationsverfahren?

    Beim Clustering werden die Datensätze in verschiedene Cluster, also Bündel, aufgeteilt mit dem Ziel, Datenbankstrukturen einfacher erfassen zu können. Die Klassifizierung hingegen ordnet einzelne Datensatzelemente Zielkategorien bzw. Zielklassen zu, um Vorhersagen zu Zielklassen bestimmter Daten treffen zu können.

  • Abhängigkeitsentdeckung

    Die Abhängigkeitsentdeckung sucht nach Mustern, deren Elemente miteinander in Beziehung stehen und voneinander abhängig sind. Beispielsweise lassen sich Zusammenhänge im Kaufverhalten bestimmter Produktgruppen erkennen. Kunden, die ein Bio-Produkt erworben haben, tendieren eher zu weiteren ökologischen Waren als zu herkömmlichen.

  • Prognose

    Bei der Prognose werden Muster einer numerischen Zielvariablen gesucht. Sie kommt zum Einsatz, um Werte wie den Umsatz im kommenden Quartal vorherzusagen.

  • Assoziationsanalyse

    Die Assoziationsanalyse ist Teil der Warenkorbanalyse. Sie wird im Englischen auch als Association Rule Learning bezeichnet und sucht nach Beziehungen zwischen Elementen im Rahmen eines bestimmten Datensatzes. Sie kommt zum Einsatz um Produkte anzuzeigen, die in der Regel zusammen gekauft werden.

  • Sequenzanalysen

    Die Sequenzanalyse ist eine Erweiterung der Assoziationsanalyse, bei der Assoziationsregeln mit Zeitbezug gesucht werden. Dabei kann es zum Beispiel um folgenden Sachverhalt handeln: In 50 % des Kaufes des Produktes A erfolgt der Kauf des Produktes B sowie des Produktes C.

Weitere Methoden sind:

  • Regressionsanalyse
  • Neuronale Netze
  • Anomalieerkennung
  • Langzeit-Memory-Verarbeitung
  • Entscheidungsbaum
  • Ausreißererkennung

Was sind Beispiele für Data Mining?

Wie Unternehmen Data Mining nutzen, zeigen folgende Beispiele:

  • Handel: Data-Mining-Modelle ermöglichen die Analyse von Kundenverhalten. Daraus lässt sich das Kaufverhalten vorhersagen.
  • Marketing: Data Mining schärft personalisiertes Marketing. Maßnahmen und Kommunikation können zielgerichtet auf den Kunden und seine individuellen Bedürfnisse zugeschnitten werden.
  • Versicherungs- und Bankenwesen: In diesen beiden Bereichen kommt Data Mining hauptsächlich für die Durchführung von Risikoanalysen zum Einsatz.
  • Text Mining: Text Mining dient der Gewinnung von Informationen sowie Mustern aus Textdateien – praktisch, wenn relevante Infos schnell erfasst werden müssen.

Was ist der Unterschied zwischen Data Mining und OLAP?

OLAP ist die Abkürzung für „Online Analytical Processing“ und meint eine Datenbank-Technologie mit der komplexe Datenanalysen durchgeführt werden können. Mittels OLAP lassen sich multidimensionale Visualisierungen erzeugen, die als OLAP-Würfel bezeichnet werden. Sie folgen den Merkmalen, mit denen sie bestimmt wurden, und sollen Situationen simulieren. Das Data Mining hingegen hat das Ziel, Korrelationen in großen Datenmengen zu erkennen, um Vorhersagen treffen zu können.

Was ist der Unterschied zwischen Data Mining und Machine Learning?

Data Mining will Muster und Tendenzen aus großen Datenmengen erkennen. Machine Learning hingegen beschreibt die Fähigkeit eines Computers, aus – unter anderem mit Data Mining erlangten – Datensätzen zu lernen.

Inhalte

    Beitrag teilen

    Autor

    Welchen Nutzen die Kombination aus menschlichem Handeln und digitalen Möglichkeiten erzeugt, weiß Matthias Sebald, Head of Power Platform & AI, genau. Zudem greift er auf jahrelange Erfahrung mit den YAVEON Produkten zurück und kennt deren Zusammenspiel wie seine Westentasche. Profitieren Sie von seiner Expertise und lassen Sie sich von ihm mitnehmen in die fachlichen Welten der YAVEON Software.

    Weitere interessante Beiträge

    Workflow Management

    Was ist Workflow Management und wie wird es effizient umgesetzt? Grundlagen, Beispiele und mehr. Jetzt informieren!

    BI Dashboard

    Was ist ein BI Dashboard und welche Vorteile hat es? Definition, Ziel, Best Practices und mehr. Jetzt informieren!

    Deep Learning

    Deep Learning ist eine auf neuronalen Netzen basierende Methode, mit der Informationen aufgenommen, verarbeitet, sowie ausgegeben werden.

    Unser Quartalsupdate

    Langweilige Newsletter, die sich lesen wie Werbung? Braucht man nicht. Stattdessen gibt es unser Quartalsupdate:

    Newsletter abonnieren

    © 2024 - YAVEON | All rights reserved

    Nach oben