From 73eb9af7ab9398091fc71b0e61ee4b56ebd801c5 Mon Sep 17 00:00:00 2001 From: Lukas Gehrke <lg58weky@studserv.uni-leipzig.de> Date: Tue, 11 Dec 2018 21:09:00 +0100 Subject: [PATCH] Resolve "Meeting Minutes 10-12-2018" --- docs/protokolle/2018-12-10.md | 49 +++++++++++++++++++++++++++++++++++ 1 file changed, 49 insertions(+) create mode 100644 docs/protokolle/2018-12-10.md diff --git a/docs/protokolle/2018-12-10.md b/docs/protokolle/2018-12-10.md new file mode 100644 index 0000000..2b32f29 --- /dev/null +++ b/docs/protokolle/2018-12-10.md @@ -0,0 +1,49 @@ +## Protokoll 10.12.2018 + +## Agenda +* Stand Gruppenmitglieder +* Planung für Freitag (Zwischenpräsentation) + +## Stand Lucas + +* CleanHTML gemergt +* Bereitet Daten für Stanford NER vor +* Außerdem: Stanford NER runtergeladen + - einfach Implementierung mit einem Befehl + - Person, Organization, Location-Version (Granularität 3) + +* Anmerkung David: Core-NLP Macht Stanfor NER in R nutzbar +* Frage David: Ist beim Stanford NER POS dabei? + - Bringt nicht wirklich Vorteil.. + +## Stand Jonas + Lukas (Rasa-Bot) + +* Bot ruft custom-Action auf und findet damit Geburtsort eines gelesenen Physikers in csv-file + - für verschreiber und groß- und kleinschreibung regex oder andere Lösung finden + +* Frage: spacy_sklearn oder tensorflow_embedding pipeline nutzen + +* Auseinandersetzung mit Rasa-Dokumentation zäh und nicht sehr ergiebig + +## Stand David + +## Stand Leonard + +## Präsentation am Freitag + +1. Forschungsfrage erklären (_Lucas_) +2. Daten vorstellen (_David_) + - Woher kommen sie + - Wie wurden sie aufbereitet? +3. Software vorstellen (_Lukas_ und _Jonas_) + - Wie funktioniert unser Rasa-Bot + - Schwierigkeiten bei der Implementierung bisher +4. Ausblick (_Leo_) + +## Ausblick + +### Aufgabe für alle +* Jeder soll sich nochmal mit Algorithmen zur Extraction von Wissen aus den Wikipedia Texten beschäftigen +* Lukas und Jonas treffen sich Mittwoch, um den Chatbot fertig zu bekommen +* alle Mitglieder erstellen reveal.md-Folien zu ihren Themen (s.o.) + -- GitLab