Data Science II (PTI01821)
Sommersemester 2023, Prof. Dr. Jens Flemming, Studiengang Data Science
Wochenstundenumfang:
- 6 SWS Vorlesung/Übung
- 2 SWS Praktikum
Modulbeschreibung:
Zu erbringende Leistungen:
- Prüfungsvorleistung während der Vorlesungszeit
- mündliche Prüfung nach der Vorlesungszeit
Vorlesungsskript
Arbeitsgrundlage für die Vorlesung ist das E-Book
des Vorlesenden. Dieses enthält auch alle Übungsaufgaben und die Projekte für das Praktikum.
Im Skript nicht enthaltene, aber in den Veranstaltungen benötigte Datensätze:
- Katzen und Hunde (0.8 GB)
Zur Ergänzung und Vertiefung des Stoffes können folgende Bücher genutzt werden:
- Python Data Science Handbook (kostenfrei, online)
- Datenanalyse mit Python (in der Bibliothek verfügbar)
- Modern Pandas (kostenfrei, online)
- Deep Learning mit Python und Keras (in der Bibliothek verfügbar)
- Machine Learning mit Python und Scikit-learn und TensorFlow (in der Bibliothek verfügbar)
Ablauf
Die 8 SWS der Veranstaltung werden wiefolgt mit Leben gefüllt:
- 3 SWS Vorlesung
- 3 SWS Übung und Diskussion
- 2 SWS Praktikum/Projekte
Sofern machbar, bringen Sie bitte zu jeder Einheit einen Laptop mit. Die für die Veranstaltung benötigte Software ist kostenfrei und wird in den ersten Veranstaltungen besprochen und gemeinsam installiert.
Prüfungsvorleistung
Im Rahmen der Praktikumseinheiten werden mehrere Software-Projekte bearbeitet. Zum Semesterende wählt jeder Studierende eines dieser bearbeiteten Projekte aus und übergibt den Quellcode an den Dozent. Die Diskussion dieses Projekts (Was? Warum? Wie? …) wird Teil der mündlichen Prüfung.
Die Abgabe des Quellcodes eines Projekts aus dem Praktikum zum Ende der Vorlesungszeit ist Prüfungsvorleistung. Welche der bearbeiteten Projekte zur Wahl stehen wird im Laufe des Semesters mitgeteilt (mindestens 3).
Prüfung
Die Prüfung findet mündlich statt und dauert ca. 30 Minuten. Etwa 50 Prozent der Zeit dienen der Diskussion des Software-Projekts (vgl. Prüfungsvorleistung). Die restliche Zeit deckt den Vorlesungsstoff ab.
Hinweise zur Online-Lehre
Falls aufgrund äußerer Umstände (Corona, Energie sparen,…) synchrone Online-Lehre notwendig wird, so wird die freie Videokonferenzplattform BigBlueButton auf Servern der Westsächsischen Hochschule Zwickau genutzt werden.
Den Link zum Betreten des BBB-Raums finden Sie im OPAL-Kurs zur Veranstaltung.
Weitere Materialien
Die folgenden Materialien werden nicht in der Veranstaltung benötigt, könnten aber trotzdem von Interesse sein.
Das alte Skript von 2021 liegt als Sammlung von Jupyter-Notebooks vor. Die Anordnung der Inhalte ist etwas anders als im aktuellen Ablauf. Zur Nutzung des alten Skripts legen Sie sich einen Ordner (z.B. lectures
) an, in den sie alle ZIP-Dateien entpacken. So funktionieren Links und Pfadangaben ohne Änderungen. Die ZIP-Dateien enthalten eine Datei index.ipynb
, welche das Inhaltsverzeichnis und Verlinkungen zu allen anderen Jupyter-Notebooks enthält. Davon wird stets nur die aktuellste Version benötigt; ältere können überschrieben werden.
- Introduction (ZIP file, 3 kB)
- Data Science II in a nutshell (HTML preview)
- Visualization (ZIP file, 1 MB)
- Matplotlib
- Matplotlib basics (HTML preview)
- Multiple plots (HTML preview)
- Axis properties (HTML preview)
- Colors and colorbars (HTML preview)
- Legends and text (HTML preview)
- Geometric objects (HTML preview)
- Raster images (HTML preview)
- Complex visualizations (HTML preview)
- Advanced Matplotlib features
- 3D plots (HTML preview)
- Animations (HTML preview)
- Seaborn (HTML preview)
- Cartopy and Mplleaflet (HTML preview)
- Matplotlib
- Basic principles of supervised learning for regression (ZIP file, 190 kB)
- Supervised learning (HTML preview)
- Linear regression (HTML preview)
- Regularization (HTML preview)
- Data preprocessing (HTML preview)
- Hyperparameter tuning (HTML preview)
- Outliers (HTML preview)
- Example: predicting house prices (part 1) (HTML preview)
- Example: predicting house prices (part 2) (HTML preview)
- Artificial neural networks for supervised learning (ZIP file, 22 MB)
- Layered feedforward ANNs
- Introduction to artificial neural networks (ANNs) (HTML preview)
- Training ANNs (HTML preview)
- ANNs with Keras and Tensorflow (HTML preview)
- Cloud computing (HTML preview)
- Convolutional neural networks (CNNs)
- Convolutional ANNs (HTML preview)
- CNNs with Keras (HTML preview)
- What did the CNN learn? (HTML preview)
- Improving CNN performance (HTML preview)
- Layered feedforward ANNs
- Further regression techniques in supervised learning (ZIP file, 301 kB)
- k-NN regression (HTML preview)
- Support vector regression (HTML preview)
- Regression trees (HTML preview)
- Ensemble methods (HTML preview)
Alte Projektaufgaben von 2021: Die Jupyter-Notebooks zu den Projektaufgaben sind in den ZIP-Dateien der entsprechenden Kapitel des alten Vorlesungsskripts enthalten.
- Visualization of Chemnitz tree data (HTML preview)
- Weather data animation (HTML preview)
- QMNIST feature reduction (HTML preview)
- House price prediction (HTML preview)
- House price prediction with ANNs (HTML preview)
- QMNIST with ANNs (HTML preview)
- Hyperparameter optimization for cats and dogs (HTML preview)
- QMNIST with CNNs (HTML preview)
- House price prediction with random forests (HTML preview)
Datensätze zum alten Skript:
- gereinigte Wetterdaten (1.2 GB)
- gereinigte Vekehrsdaten (2.4 GB)
- Katzen und Hunde (0.8 GB)
Altes Prüfungsprojekt von 2021:
- Aufgabe als PDF-Datei
- Wetterdaten (basieren auf Daten des Deutschen Wetterdienstes)