Skip to content
Snippets Groups Projects

transposed dataframe in loom_to_pandas, added docs, test for main-methods,...

Merged Paul Kuehnel requested to merge dev into main
2 files
+ 70
6
Compare changes
  • Side-by-side
  • Inline
Files
2
+ 17
6
# Big Data Praktikum Autoencoder
## 0. Test Data Frame
* auseinandersetzung mit loom-file
* auseinandersetzung mit loom-file (loompy verwenden, loom Datei einlesen & pandas erstellen)
* checken wie ein repräsentatives Pandas Data Frame aussehen kann
* eins zum testen erstellen.
### 0.1 Datenformat
@@ -9,10 +9,10 @@
* ever row is a gene which can be expressed or not..
## 1. Data-Access
1. Get Data from API
2. get it into a "good" format
-> what do we need ?
### 1.2. Loom-Files
1. Get Data from API
2. get it into a "good" format
-> what do we need ?
# 1.1. Loom-Files
* Idee: Meta Data durch ID behalten, Daten ohne Metadaten nehmen & in Autoencoder reintun.
* Idee: Pandas Data Frames extrahieren für den Autoencoder.
also jeder Data Frame = 1 Input für Encoder.
@@ -148,5 +148,16 @@ enthält folgende Zeilenattribute (`ds.ra[:][:]`):
## 2. Auto Encoder
* reinlesen
* welche bibliotheken ?
* scientific computing resources, wie verwendet man die ?
## 3. Visualisation
\ No newline at end of file
## 3. Visualisation
Ziel: Visualisierung des Clusters
* latent space
* Idee: Autoencoder output, z.B. 50 Dimensionen
* Darauf Dimensionsreduktions-Algorithmen anwenden
* z.B. t-SNE und uMap was macht Sinn, auf wie viele Dimensionen wollen wir runter ? Glaube auf 2
* Clusteranalyse dann auf 2-dimensionalem anwenden ?
* welche.. kMeans z.B. ?
* [Dokument zu Clusteralgorithmen](https://www.kde.cs.uni-kassel.de/wp-content/uploads/ws/LLWA03/fgml/final/Kirchner.pdf)
\ No newline at end of file
Loading