Skip to content

Resolve "Prepare presentation slides"

Lukas Gehrke requested to merge 50-prepare-presentation-slides into master

Abschlusspräsentation für die Rasa-Gruppe

Aufteilung:

Noch ToDo

  • @df15nocu schreibe weitere Info zu 'get_spouse.R'

  • @df15nocu Füge Precision/Recall zu 'get_spouse.R'

  • @ls80zyse schreibe weitere Info zu 'get_awards.R'

  • @lg58weky Fixe typo bei Plot "Eregnisse"

  • @lg58weky Schiebe Gesamtarchitketur vor Skript Demos

  • @lg58weky Gehe in der Präsentation nochmal expliziet auf Actions ein

  • @lg58weky Baue intent:chitchat ein, um sachen wie 'how are you' zu handeln

  • @jw32vufi Baue Fallback Action für Bot - siehe #68 (closed)

  • @lh85myqa Beispielanfragen an den Bot: 3 die Funktionieren, eine mit Rechtschreibfehler und eine ohne Ergebnis

Gliederung

Recap - Überblick über Thema/Aufgabe

  • Forschungsfrage
  • Rasa, Thema Chatbots
  • Ziel Die Zuhörer über unser Thema, Ziel und letzten Stand aufklären

Unser Herangehen

  • Rasa-Bot konfigurieren -> für Training werden entities und intents benötigt

    • Definition intent
    • Aufstellen von Liste mit Intents zu Physikern (Liste einfügen)
    • Daten akquirieren (982 Wikipedia-Artikel)
  • Processing -> eigenes R-package ("wikiproc")

    • Crawling von reinem HTML, cleaning-Skript
    • Zu jedem Intent eigenes Verfahren zur Extraktion
    • Beispiele (awards, spouse, university, birthdate)
  • Gesamtlösung: Schaubild zu Architektur

    • data.tsv verbindet Bot und processing
    • processing als Teil des Bot-Trainings
  • Demo des Bots

Ergebnisse

  • Evaluation der Ergebnisse

    • Warum viele NAs?
    • Precision/Recall Plots (birthdate, awards, spouse)
  • Bewertung RASA-Software

    • Setup schwierig
    • Keine Beispiel in Manuals, keine Dokumentation in Beispielen
  • Bewertung Wikipedia-Artikel als unstrukturierte Daten als Grundlage

    • (+) relativ ähnlicher Aufbau
    • (-) dennoch im Detail unterschiede ("persönliche Note" ständig unterschiedlicher Autoren)
    • (-) unterschiedlich ausführlich
  • Beantwortung der Forschungsfrage

Kann man dieses Wissen aus Texten generieren?

  • Ja, nutze Pattern, NER

Lässt sich dieses Wissen automatisch generieren?

  • Nein. Intents sollten vorher generiert werden, dann lässt sich das Wissen mit auf den Intent und die Datengrundlage zugeschnittenen Verfahren extrahieren

Closes #50 (closed) Closes #61 (closed)

Edited by Lukas Gehrke

Merge request reports