planung: Protokoll des Treffens vom 7.3.19 mit Prof. Heyer authored by Maciej Sumalvico's avatar Maciej Sumalvico
...@@ -1053,3 +1053,35 @@ Wir bauen zunächst einen echten Datensatz zu Demozwecken auf. Wir probieren dif ...@@ -1053,3 +1053,35 @@ Wir bauen zunächst einen echten Datensatz zu Demozwecken auf. Wir probieren dif
### 17. Oktober (mit Prof. Heyer) ### 17. Oktober (mit Prof. Heyer)
### 7. März (mit Prof. Heyer)
- nächstes Treffen mit Prof. Heyer: Do 21.3, 11:30 Uhr
- bis Mitte April lauffähige Prototype für beide Ansätze
#### Aufgaben von Maciej (cor-asv-fst)
- Merge vom neuen Fehlermodell + Evaluierung + Vgl. mit dem alten Fehlermodell
- sliding window: Vergleich der Ergebnisse zw. der neuen und alten
Implementierung
- Branch "wrapping" mit den o.g. Änderungen integrieren
- Austausch von Fenster-FSTs zw. C++-Teil und Python-Teil -- bessere Lösung als
über Temporärdateien?
- Bzgl. auf den obigen Punkt: Wechsel von HFST zu pynini erwägen (wie viel
Aufwand?)
- Vielleicht: Beschleunigung (durch Parallelisierung) des Trainings vom
Fehlermodell
#### Aufgaben von Robert (cor-asv-ann, ocrd_keraslm)
- Attention rein, Windowing raus
- Modul-Kapselung, besseres CLI
- Integration/Wrapping
- Training LM-Varianten, Transfer alter Modelle
- Update auf OCRD 1.0, Docker (für ocrd_keraslm)
#### Allgemeines
Für die Repos wird ein eindeutiger Maintainer bestimmt (`cor-asv-fst`: Maciej,
`cor-asv-ann`: Robert), der als einzige Person direkte Commits macht. Der
jeweils andere schlägt Änderungen über Pull Requests vor.