Für sehr viele Sprachen verfügbar. Interessant sind hier vor allem Alt-Griechisch und Latein.
Daten im Treebank-Format.
[Ridges Corpus](https://www.linguistik.hu-berlin.de/de/institut/professuren/korpuslinguistik/forschung/ridges-projekt) – Register in Diachronic German Science
[SRCMF](http://srcmf.org/) – Syntactic Reference Corpus of Medieval French
[Penn Parsed Corpora of Historical English](https://www.ling.upenn.edu/hist-corpora/) – Leider nicht frei verfügbar.
## Historische Schreibweisen
Die folgenden beiden Datenbanken kamen bei der Entwicklung von CAB zum Einsatz.
Siehe auch die Präsentation [Canonicalizing Historical Text with CAB](/uploads/98d90d8ac577648601bb84e0bdd4b1f9/Canonicalizing_Historical_Text_with_CAB__Slides_.pdf) von Bryan Jurish.
[Alignment-based Corpus der DWDS]
(http://kaskade.dwds.de/demo/dtaec/)
– 120 volumes (1780 bus 1901), 5.6M tokens, 212k types