Data Mining PDF Drucken E-Mail

 

Data Mining setzen wir als ergänzende Methodik ein, wenn wir aus goßen Datenmengen neue Erkenntnisse gewinnen wollen. Wir sind dann in der Lage, die Analyse- und Prognosegenauigkeiten weiter zu verbessern. Die heutigen Möglichkeiten der Massendatenerfassung, die hohe Verfügbarkeit und
die geringen Kosten der Speichermedien ermöglichen uns, Data Mining Methoden mit einem guten Kosten-Nutzen-Verhältnis einzusetzen.

 

Datenselektion

In der vertikalen Datenselektion werden die relevanten Analyseobjekte oder Tupel bestimmt. Die relevanten Attribute werden im Zuge der horizontalen Datenselektion festgelegt. Verfügbare Metadaten können für die Auflösung semantischer Unklarheiten während der Datenbereinigung und während der Ergebnisinterpretation ebenfalls extrahiert werden.

Die Qualität und Quantität der ermittelten Daten beeinflusst dabei maßgeblich die späteren Analysemöglichkeiten sowie die Qualität der Ergebnisse. Spezifisches Wissen über potenzielle Datenquellen und ihre Erschließung ist daher unabdingbar. Nachdem die Daten aus den jeweiligen vorhandnenen Systemen extrahiert worden sind, müssen sie für die weitergehende Analyse inhaltlich und formal aufbereitet werden.

 

Daten in Papierform

In der Praxis stoßen wir immer wieder auf wertvolle Daten, die nur in Papierform vorhanden sind. Meist sind diese Daten gut strukturiert, so das sie mit modernen OCR-Methoden digitalisiert werden können und auf diese Weise die Ergebnisse eines Data Mining Prozesses erheblich verbessern können.

 

Nichtformatierte Daten

Data-Mining-Methoden setzen auf formatierten Daten in Form von skalierten Merkmalen auf. Nichtformatierte Daten, beispielsweise Textdokumente (Kundenbeschwerden, Anfragen etc.), bleiben bei der Datenselektion meist unberücksichtigt. Allein über deskriptive Verfahren lassen sich hieraus bereits relevante Daten ermitteln. Durch die Anwendung von Textmining-Techniken können auch solche Daten zum Dataminig ergebnisverbessernd herangezogen werden.

 

Externe Datenquellen

Aus der Sicht unserer Kunden sind Steinbeis Daten externe Datenquellen. Diesen bilden einen besonders wertvollen Datenberstand, da sie branchen- und aufgabenspezifisch selektiert werden können. Auch unsere Steinbeis Zugänge zu Statistiken und Verbandsinformationen bieten eine zusätzliche Datenquelle für kundenspezifische Datamining Verfahren.

Zuletzt aktualisiert am Freitag, den 22. Juli 2011 um 20:57 Uhr