Big-Data Praktikum
Übersicht
Das Praktikum beinhaltet den Entwurf und die Realisierung einer Anwendung oder eines Algorithmus im Big-Data und Machine-Learning-Umfeld. In der Regel erfolgt die Implementierung unter Verwendung von Big-Data oder Deep-Learning-Frameworks.
Im einzelnen sind folgende Teilaufgaben zu lösen:
- Konzeptioneller Entwurf. Es ist ein Entwurfsdokument anzufertigen, welches konzeptionell den Ablauf und die Architektur ihrer Anwendung darstellt. Im Dokument muss ersichtlich werden, welches Ziel verfolgt wird und welche Aufgaben dafür zu bewältigen sind. Das Dokument soll sich vom Umfang auf ca. 4 Seiten beschränken.
- Implementierung. Basierend auf ihrem Entwurf soll die Anwendung realisiert werden. Das Resultat dieser Phase ist ein dokumentiertes, ausführbares Programm.
- Abschlusspräsentation Am Ende des Praktikums stellt jede Gruppe ihr Projekt vor, wobei sie ihre Anwendung beschreibt sowie die Resultate präsentiert. Die Dauer der Präsentation soll ca. 10 Minuten (+ 5 min. Diskussion) betragen.
Anmeldung und Präsenzveranstaltungen
-
Die Anmeldung zum Praktikum erfolgt über Almaweb.
- Bei Fragen und Problemen zur Anmeldung wenden Sie sich bitte immer an das Studienbüro via einschreibung(at)math.uni-leipzig.de
-
Für die endgültige Anmeldung und Themenzuordnung melden Sie sich im Moodle unter folgender Adresse an: Anmeldung Moodle
Sie haben bis zum 18.04. Zeit Ihre präferierten Themen und Wunschpartner anzugeben. -
Vorbesprechung
- Erste Mailkommunikation für die Konkretisierung des Themas und die ersten Schritte werden mit dem Betreuer per Mail abgehalten.
Testate
Das Praktikum gliedert sich in drei Teile. Nach jeder der drei Teilaufgaben wird eine Dokumentation oder ein Testat per Skype/Slack/ oder ähnliches durchgeführt. Die Art der Durchführung soll mit dem Betreuer individuell abgesprochen werden. Zum erfolgreichen Absolvieren des Praktikums müssen alle drei Testate erfolgreich abgelegt werden. Wird ein Termin nicht eingehalten, verfallen die bereits erbrachten Teilleistungen. Die konkreten Termine für die ersten zwei Testate bzw. Abgabe sind mit dem Betreuer per E-Mail zu vereinbaren. Es gelten die nachfolgenden Fristen:
- Testat 1 (Entwurf): Ende Mai
- Testat 2 (Realisierung): Mitte-Ende Juli
- Testat 3 (Präsentation): tba
Themen
Bitte vereinbaren Sie zeitnah einen Termin mit Ihrem Betreuer zur Besprechung der ersten Schritte!
Nr | Thema | Betreuer | Technologie | Studenten | Material |
---|---|---|---|---|---|
01 | Film- und Serien Temporal Graph (Netflix, Disney+, Prime, Hulu) | C. Rost | Java | -- | |
02 | Synthetische Zeitreihen | T. Burghardt | Python | -- | |
03 | Analyse und Vorhersage städtischer Emissionen | L. Lange | Python | Datensatz-Paper | |
04 | LID-DS to Beagle | M. Grimmer | Python | -- | |
05 | Playlist Link Prediction | D. Obraczka | Python | -- | |
06 | Autoncoder auf Human Cell Atlas-Daten | J. Ewald, M. Joas | Python | -- | |
07 | Lernen demographischer Informationen über Personen aus der Point-of-interest (POI) Historie | M. Schneider | Python | -- | |
08 | -- | ||||
09 | -- | ||||
10 | -- | ||||
11 | -- | ||||
12 | -- | ||||
13 | -- | ||||
14 | -- |
Teilnehmerkreis
Master-Studiengänge Data-Science und bei freien Plätzen auch Master-Studiengänge Informatik. Die Teilnahme erfolgt in 2er-Gruppen, die Teilnehmerzahl ist auf ca. 24 Studierende beschränkt!. Zu beachten ist, dass Studenten, die das Big-Data-Praktikum noch nicht belegt haben, bevorzugt werden.
Erwartete Vorkenntnisse
- Java/Python/...-Kenntnisse (siehe Technologie in Tabelle)
- Vorlesung Cloud Data Management und NoSQL-Datenbanken hilfreich
- Linux-Kenntnisse von Vorteil
- Git-Kenntnisse von Vorteil