Big Data Anwendungen Sommersemester 2024
Aktuelles
- Alle zentralen Informationen finden sich zuerst immer auf unserer E-Learning Seite
Termine
Die Veranstaltung wird geblockt durchgeführt (vgl. LSF):
Termin | Uhrzeit | Raum |
---|---|---|
31.05.24 | 10:00 - 18:00 | G40B-231 |
01.06.24 | 10:00 - 18:00 | G40B-231 |
02.06.24 | 10:00 - 18:00 | G40B-231 |
07.06.24 | 10:00 - 18:00 | G40B-231 |
08.06.24 | 10:00 - 18:00 | G40B-231 |
09.06.24 | 10:00 - 18:00 | G40B-231 |
Inhalt
Im Rahmen der Lehrveranstaltung werden moderne Verfahren der Datenanalyse vorgestellt und deren wirtschaftlicher Nutzen mit Anwendungsbeispielen unterlegt. Um das Wissen zu den Verfahren zu vertiefen werden Übungen durchgeführt bei welchen mit marktüblichen Tools verschiedene Anwendungsprobleme durch die Studierenden selbständig gelöst werden.
Gliederung und Folien
- Einführung
- Deskriptive Methoden zur Datenexploration
- Datenqualität
- Klassifikation
- Recommender Systeme
- Clusteringverfahren
- Stream Mining
- Social Network Analysis
- Technische Lösungen
- Datenschutz und gesellschaftliche Aspekte
Übungsblätter
- Aufgabenblatt 1 - Deskriptive Methoden (Bearbeitungsvorschlag)
- Aufgabenblatt 2 - Klassifikation (Bearbeitungsvorschlag)
- Aufgabenblatt 3 - Recommender Systems (Bearbeitungsvorschlag)
- Aufgabenblatt 4 - Clusteringverfahren (Bearbeitungsvorschlag)
- Aufgabenblatt 5 - Stream Mining (Bearbeitungsvorschlag)
- Aufgabenblatt 6 - Social Network Analysis (Bearbeitungsvorschlag)
Praxisübungsblätter
Klausuren
- Probeklausur
- Sommersemester 2017
- Sommersemester 2018
- Sommersemester 2019
- Sommersemester 2020
- Sommersemester 2021
- Sommersemester 2022
- Sommersemester 2023
Quellen für Datenanalyse
- Datensätze mit Analyseaufgaben
- Knime (graphisches Tool)
- Lösungsvorschläge lassen sich über das Menü (File -> Import Knime Workflow…) importieren
- Nicht vergessen: In den Knoten zum Laden der Daten den Pfad anpassen!
- Anaconda (Pythoninstallation für verschiedene Betriebsysteme)
- Beim Download bevorzugt Version 3.8 wählen
- Starten der Lösungsvorschläge (in der Konsole): ipython notebook ‘[Name der Datei mit Endung .ipynb]’
- Ggfs. müssen Pakete nachinstalliert werden (in der Konsole): pip install ‘[Name des gesuchten Pakets]’
(Bei mir war das: pip install ipython notebook pandas sklearn matplotlib) - Nicht vergessen: In den Funktionsaufrufen zum Laden der Daten den Pfad anpassen!