diff --git a/docs/protokolle/2018-12-10.md b/docs/protokolle/2018-12-10.md new file mode 100644 index 0000000000000000000000000000000000000000..2b32f2984ffd3fcad9d75d3f022c1b898783b428 --- /dev/null +++ b/docs/protokolle/2018-12-10.md @@ -0,0 +1,49 @@ +## Protokoll 10.12.2018 + +## Agenda +* Stand Gruppenmitglieder +* Planung für Freitag (Zwischenpräsentation) + +## Stand Lucas + +* CleanHTML gemergt +* Bereitet Daten für Stanford NER vor +* Außerdem: Stanford NER runtergeladen + - einfach Implementierung mit einem Befehl + - Person, Organization, Location-Version (Granularität 3) + +* Anmerkung David: Core-NLP Macht Stanfor NER in R nutzbar +* Frage David: Ist beim Stanford NER POS dabei? + - Bringt nicht wirklich Vorteil.. + +## Stand Jonas + Lukas (Rasa-Bot) + +* Bot ruft custom-Action auf und findet damit Geburtsort eines gelesenen Physikers in csv-file + - für verschreiber und groß- und kleinschreibung regex oder andere Lösung finden + +* Frage: spacy_sklearn oder tensorflow_embedding pipeline nutzen + +* Auseinandersetzung mit Rasa-Dokumentation zäh und nicht sehr ergiebig + +## Stand David + +## Stand Leonard + +## Präsentation am Freitag + +1. Forschungsfrage erklären (_Lucas_) +2. Daten vorstellen (_David_) + - Woher kommen sie + - Wie wurden sie aufbereitet? +3. Software vorstellen (_Lukas_ und _Jonas_) + - Wie funktioniert unser Rasa-Bot + - Schwierigkeiten bei der Implementierung bisher +4. Ausblick (_Leo_) + +## Ausblick + +### Aufgabe für alle +* Jeder soll sich nochmal mit Algorithmen zur Extraction von Wissen aus den Wikipedia Texten beschäftigen +* Lukas und Jonas treffen sich Mittwoch, um den Chatbot fertig zu bekommen +* alle Mitglieder erstellen reveal.md-Folien zu ihren Themen (s.o.) +