Update planung authored by Robert Sachunsky's avatar Robert Sachunsky
......@@ -930,5 +930,35 @@ Wir haben die Daten `dta19-reduced` und Modelle von Kay übergeben und eine Anle
Das CIS hat beim Bibliotheca Baltica Symposium nichts eingereicht und wird vielleicht nicht dort sein, weil Florian und Tobias in diesem Semester eine Vorlesung übernehmen müssen.
### 13. August (mit Prof. Heyer)
Wir werden den Zwischenbericht für die Koordinatoren (für deren DFG-Bericht) im [Wiki](/Berichte#zwischenbericht-f%C3%BCr-dfg-31082018) abfassen (mit Bezug zu den AP im Antrag).
Auch die Untersuchungen zur FST-Performanz und zu Kopplungsmöglichkeiten könnten interessant genug für eine Veröffentlichung sein.
### 11. September (mit Prof. Heyer)
Maciej und Lena sollten möglichst beide mit nach Galway kommen. Maciej kommt mit nach Rostock.
### 18. September Videokonferenz OCR-D
[offizielles Protokoll](https://wiki.de.dariah.eu/pages/viewpage.action?spaceKey=OCR&title=2018-09-18+Besprechungsnotizen)
[Vortragsfolien](https://ocr-d.github.io/2018-09-18/)
Ergebnisse:
- Alle Modulprojekte haben sich bereiterklärt, ein öffentliches Github-Repo unter der [Lizenz Apache 2.0](https://github.com/OCR-D/core/blob/master/LICENSE) bereitzustellen. Für das DFKI bedeutet das zusätzlichen Aufwand beim Abtrennen nicht-freier/öffentlicher Teile. Für uns bedeutet es (wahrscheinlich) Aufteilung unseres Gitlab-Repos in mehrere unabhängige Komponenten (FST-Ansatz, RNN-Ansatz, Vorträge) und deren Spiegelung auf Github, hier dann nur noch das zentrale Wiki.
- [Vorhandener GT](http://www.ocr-d.de/sites/all/GTDaten/IndexGT.html) wird in den nächsten Wochen neu exportiert, um alle aufgekommenen Issues zu beseitigen. Vollständiger GT wurde ausgeschrieben und demnächst beauftragt.
- Es gibt unabhängig davon jetzt einen neuen [historischen GT](https://zenodo.org/record/1344132) von Uwe Springmann.
- Repositorien für Forschungsdaten, Modelle und Fonts kommt erst im Frühjahr. Wir sollen möglichst jetzt unsere Anforderungen kundtun.
- Das [Assets-Repo](https://github.com/OCR-D/assets) darf und soll für den Bedarf der MP an automatischen Tests erweitert werden.
- Die Modulprojekte sollen möglichst früh (jetzt) ihre Alpha-Version auf Github sichtbar machen, möglichst früh mit Dockerfile und semantischer Versionierung arbeiten, möglichst früh eine Minimaldokumentation und eine CI-Konfiguration hinterlegen.
- Für die [neue Tesseract-Release](https://github.com/tesseract-ocr/tesseract/wiki/Planning) werden jetzt letzte Änderungswünsche angenommen. Unser Bedarf kann noch berücksichtigt werden. Die Arbeit zur Ausgabe der Glyph-Alternativen/Konfidenzen bei den LSTM ist nahezu abgeschlossen. (Dazu wurde die API erweitert, die alte via `GetChoiceIterator` wird aber parallel gepflegt.) Das Integrationsmodell für OCR-D bleibt der [Workspace-Wrapper](https://github.com/OCR-D/ocrd_tesserocr).
- Ein ähnliches Projekt zu Multi-OCR mit Beteiligung der UB Mannheim heißt [ocromore](https://github.com/UB-Mannheim/ocromore).
- Kay kommt zum [Deeplearning-Bootcamp](https://indico.mpi-cbg.de/e/deeplearning2018) nach Dresden und trifft sich in dieser Zeit mit Robert zur weiteren Abstimmung.
- Kay will sich demnächst mit CIS und ASV treffen, um deren Bedarf an (realistischen, umfänglichen) Trainingsdaten aus OCR-Pipelines zu decken.
- Entwicklertreffen in Rostock wird (mangels Teilnehmer) nur im kleinen Rahmen stattfinden: während Transkribus-Workshop (9 - 10:30 Uhr in einem separaten Raum)
### 4. - 5. Oktober ([Bibliotheca Baltica](https://www.bb2018.uni-rostock.de/) in Rostock)
### 17. Oktober (mit Prof. Heyer)