Data Mining setzen wir als ergänzende Methodik ein, wenn wir aus goßen Datenmengen neue Erkenntnisse gewinnen wollen. Wir sind dann in der Lage, die Analyse- und Prognosegenauigkeiten weiter zu verbessern. Die heutigen Möglichkeiten der Massendatenerfassung, die hohe Verfügbarkeit und die geringen Kosten der Speichermedien ermöglichen uns, Data Mining Methoden mit einem guten Kosten-Nutzen-Verhältnis einzusetzen.

 

Datenselektion

In der vertikalen Datenselektion werden die relevanten Analyseobjekte oder Tupel bestimmt. Die relevanten Attribute werden im Zuge der horizontalen Datenselektion festgelegt. Verfügbare Metadaten können für die Auflösung semantischer Unklarheiten während der Datenbereinigung und während der Ergebnisinterpretation ebenfalls extrahiert werden.

Die Qualität und Quantität der ermittelten Daten beeinflussen dabei maßgeblich die späteren Analysemöglichkeiten sowie die Qualität der Ergebnisse. Spezifisches Wissen über potenzielle Datenquellen und ihre Erschließung ist daher unabdingbar. Nachdem die Daten aus den jeweiligen vorhandenen Systemen extrahiert worden sind, müssen sie für die weitergehende Analyse inhaltlich und formal aufbereitet werden.

 

Daten in Papierform

In der Praxis stoßen wir immer wieder auf wertvolle Daten, die nur in Papierform vorhanden sind. Meist sind diese Daten gut strukturiert, so dass sie mit modernen OCR-Methoden digitalisiert werden können und auf diese Weise die Datenbasis eines Data Mining Prozesses erheblich verbessern können.

 

Nichtformatierte Daten

Data-Mining-Methoden setzen auf formatierte Daten in Form von skalierten Merkmalen auf. Nichtformatierte Daten, beispielsweise Textdokumente (Kundenbeschwerden, Anfragen etc.), bleiben bei der Datenselektion meist unberücksichtigt. Allein über deskriptive Verfahren lassen sich hieraus bereits relevante Daten ermitteln. Durch die Anwendung von Textmining-Techniken können auch solche Daten zum Dataminig ergebnisverbessernd herangezogen werden.

 

Externe Datenquellen

Aus der Sicht unserer Kunden sind Steinbeis Daten externe Datenquellen. Diesen bilden einen besonders wertvollen Datenberstand, da sie branchen- und aufgabenspezifisch selektiert werden können. Auch unsere Steinbeis Zugänge zu Statistiken und Verbandsinformationen bieten eine zusätzliche Datenquelle für kundenspezifische Datamining Verfahren.