Update Ressourcen authored by Robert Sachunsky's avatar Robert Sachunsky
......@@ -53,6 +53,9 @@ Siehe auch die Präsentation [Canonicalizing Historical Text with CAB](/uploads/
* (auf 100 Mrd Token Google-News-Text zu 3 Mio Types mit 300 Dimensionen) vorberechnetes Modell für [Englisch](https://s3.amazonaws.com/dl4j-distribution/GoogleNews-vectors-negative300.bin.gz)
* (auf 650 Mio Token News- und Wikipedia-Text zu 600.000 Types mit 300 Dimensionen) vorberechnetes Modell für [Deutsch](https://devmount.github.io/GermanWordEmbeddings/)
[GloVe](https://nlp.stanford.edu/projects/glove/) – ähnlich, aber nach [Pennington et al 2014](https://nlp.stanford.edu/pubs/glove.pdf)
* (auf 840 Mrd Token Webtext zu 2.2 Mio Types mit 300 Dimensionen) vorberechnetes Modell für [Englisch](http://nlp.stanford.edu/data/glove.840B.300d.zip)
[fastText](https://github.com/facebookresearch/fastText) – ähnlich, aber nach [Bojanowski & Grave et al 2017](https://arxiv.org/pdf/1607.04606.pdf)
* (auf kompletter Wikipedia mit 300 Dimensionen) vorberechnetes Modell für [Deutsch](https://s3-us-west-1.amazonaws.com/fasttext-vectors/wiki.de.vec)
......
......