Resolve "Prepare presentation slides"
Abschlusspräsentation für die Rasa-Gruppe
Aufteilung:
Noch ToDo
-
@df15nocu schreibe weitere Info zu 'get_spouse.R' -
@df15nocu Füge Precision/Recall zu 'get_spouse.R' -
@ls80zyse schreibe weitere Info zu 'get_awards.R' -
@lg58weky Fixe typo bei Plot "Eregnisse" -
@lg58weky Schiebe Gesamtarchitketur vor Skript Demos -
@lg58weky Gehe in der Präsentation nochmal expliziet auf Actions ein -
@lg58weky Baue intent:chitchat
ein, um sachen wie 'how are you' zu handeln -
@jw32vufi Baue Fallback Action für Bot - siehe #68 (closed) -
@lh85myqa Beispielanfragen an den Bot: 3 die Funktionieren, eine mit Rechtschreibfehler und eine ohne Ergebnis
Gliederung
Recap - Überblick über Thema/Aufgabe
- Forschungsfrage
- Rasa, Thema Chatbots
- Ziel Die Zuhörer über unser Thema, Ziel und letzten Stand aufklären
Unser Herangehen
-
Rasa-Bot konfigurieren -> für Training werden entities und intents benötigt
- Definition intent
- Aufstellen von Liste mit Intents zu Physikern (Liste einfügen)
- Daten akquirieren (982 Wikipedia-Artikel)
-
Processing -> eigenes R-package ("wikiproc")
- Crawling von reinem HTML, cleaning-Skript
- Zu jedem Intent eigenes Verfahren zur Extraktion
- Beispiele (awards, spouse, university, birthdate)
-
Gesamtlösung: Schaubild zu Architektur
-
data.tsv
verbindet Bot und processing - processing als Teil des Bot-Trainings
-
-
Demo des Bots
Ergebnisse
-
Evaluation der Ergebnisse
- Warum viele NAs?
- Precision/Recall Plots (birthdate, awards, spouse)
-
Bewertung RASA-Software
- Setup schwierig
- Keine Beispiel in Manuals, keine Dokumentation in Beispielen
-
Bewertung Wikipedia-Artikel als unstrukturierte Daten als Grundlage
- (+) relativ ähnlicher Aufbau
- (-) dennoch im Detail unterschiede ("persönliche Note" ständig unterschiedlicher Autoren)
- (-) unterschiedlich ausführlich
-
Beantwortung der Forschungsfrage
Kann man dieses Wissen aus Texten generieren?
- Ja, nutze Pattern, NER
Lässt sich dieses Wissen automatisch generieren?
- Nein. Intents sollten vorher generiert werden, dann lässt sich das Wissen mit auf den Intent und die Datengrundlage zugeschnittenen Verfahren extrahieren
Closes #50 (closed) Closes #61 (closed)