Skip to content
Snippets Groups Projects
Commit 03da1170 authored by Lucas Schons's avatar Lucas Schons
Browse files

Merge branch '50-prepare-presentation-slides' of...

Merge branch '50-prepare-presentation-slides' of git.informatik.uni-leipzig.de:text-mining-chatbot/wiki-rasa into 50-prepare-presentation-slides
parents ca3b4424 e769610e
No related branches found
No related tags found
2 merge requests!71Documentation: Final Report,!59Resolve "Prepare presentation slides"
......@@ -66,6 +66,7 @@ Dies soll anhand der _Wikipedia-Einträge von Physikern_ erprobt werden
* Für Training eines Bots werden _entities_, _text_ und _intents_ benötigt
* Definition _intent_ aus [RASA Docs](https://rasa.com/docs/nlu/dataformat/):
_"The intent is the intent that should be associated with the text."_
* Antworten über _Custom Actions_, dafür **Wissensbasis** benötigt
<!--s-->
......@@ -115,6 +116,13 @@ Note: Zu jedem Intent ein R-Skript. Master lädt die Artikel, speichert sie in e
<!--s-->
### Lösungsansatz - Gesamtarchitektur
<img src="Wiki_Chatbot_Architecture.png" width="100%">
Note: Schaubild der Gesamtarchitektur einfügen, AUF JEDEN FALL mit docker-Wal
<!--s-->
### Lösungsansatz - Processing, Extraktion Intents
#### `R/get_awards.R`
......@@ -127,25 +135,9 @@ Note: Zu jedem Intent ein R-Skript. Master lädt die Artikel, speichert sie in e
### Lösungsansatz - Processing, Extraktion Intents
* Beispiel `R/get_spouse.R`
* Nutze _Pattern_ sowie _NER-Entities_ und _POS-Tags_
<!--s-->
### Lösungsansatz - Gesamtarchitektur
<img src="Wiki_Chatbot_Architecture.png" width="100%">
Note: Schaubild der Gesamtarchitektur einfügen, AUF JEDEN FALL mit docker-Wal
```
rasa
├── actions.py - Custom Actions
├── domain.yml - Entitäten, Antwortvorlagen
├── nlu.md - Intents, Fragebeispiele
├── nlu_config.yml - Pipeline
├── data
│ └── data.tsv - Daten für den Bot
└── stories.md - Gesprächsverläufe
```
* Identifiziere Sätze über Schlüsselwort _marry_ (lemma)
* Nutze _Pattern_ auf _POS-Tags_
* Verifiziere Ergebnisse über Physikernamen sowie _NER-Entities_
<!--s-->
......@@ -171,14 +163,19 @@ Note: fancy plots mit precision und recall zu awards, birthdate und spouse
<!--s-->
### Ergenisse
##### Precision zu 'get_birthdate.R'
### Ergebnisse
<img src="plots/precision_birthdate.png" width="50%">
<img src="plots/precision_birthdate.png" width="70%">
Note: Die Auswertung erfolgte händisch über die ersten 300 Ergebnisse von get_birthdate.R mit den Ergebnissen der infobox als ground truth (auch wenn hier tlw NA steht). Als partial match wurden solch Ergebnisse gewertet, die sinnvolle Daten sind und bis auf das Fehlen des Tages mit dem Referenzwert aus der Infobox übereinstimmen (BSP: infobox: "3 May 1960"; get_birthdate: "May 1960"). Als full match wurden solche Ergebnisse gewertet, die sinnvolle Daten sind und als Zeitangabe gegenüber der infobox nicht weniger ausführlich sind (kein Fehlen von Tag etc)
<!--s-->
##### Auswertung zu 'get_spouse.R'
<img src="plots/spouse_eval.png" width="50%">
Note: Recall noch ausbaufähig über integration weiterer Pattern.
<!--s-->
### Bewertung Software/Datengrundlage I
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment