Lab - Data Mining Algorithmen

Year: WS 2007
Lecturer: Univ.-Prof. Dr. rer. nat. T. Seidl
Type: Lab
Form: Praktikum
Language: DE
Content:  

Um aus vorhandenen Datenbeständen neue wertvolle Informationen zu gewinnen, werden im Data Mining verschiedene Techniken wie z. B. Klassifikation, Clusteranalyse und das Auffinden von Assoziationsregeln angewandt. Auf dem Markt existiert bereits eine große Anzahl von Data-Mining-Tools, die diese Verfahren unterstützen und für jedes meist mehrere unterschiedliche Algorithmen anbieten. Diese Tools werden teilweise als eigenständige Software, oft aber auch als Add-on zu bestehenden Datenbanksystemen angeboten, wo die Algorithmen unmittelbar im Datenbankserver ausgeführt werden können. Neben den reinen Funktionsbibliotheken werden häufig auch entsprechende Oberflächen mitgeliefert, die eine komfortable Anwendung der implementierten Verfahren auf vorhandene Datenmengen erlauben und die Ergebnisse grafisch aufbereiten. Nur wenige Tools unterstützen allerdings eine einfache Integration selbst programmierter Algorithmen in die Software.

Im Rahmen des Praktikums werden einige Data-Mining-Tools auf ihre Nützlichkeit untersucht und auch um eigene Algorithmen erweitert. In der ersten Phase des Praktikums sollen dazu zunächst verschiedene Data-Mining-Szenarien mit Hilfe der von den Systemen angeboteten Oberflächen durchgespielt und vergleichend analysiert werden. Die erarbeiteten Ergebnisse werden anschließend sowohl direkt am System als auch in separaten Vorträgen präsentiert. Für die zweite Phase ist dann die Erweiterung eines der Systeme um neue Data-Mining-Algorithmen vorgesehen. Neben der reinen Implementierung sollen auch hier wieder verschiedene Szenarien durchgespielt und analysiert und die Ergebnisse in Vorträgen präsentiert werden. Außerdem sind entsprechende Praktikumsberichte zu erstellen, die die durchgeführten Tätigkeiten und die Ergebnisse beschreiben.

 

Neben einem abgeschlossenen Vordiplom als Voraussetzung ist es hilfreich, über Kenntnisse aus den Vorlesungen ''Data Mining Algorithmen'', ''Einführung in Datenbanken'', ''Indexstrukturen für Datenbanken'' sowie ''Modelle der Datenexploration'' zu verfügen.