diff --git a/processing/wikiproc/R/get_data.R b/processing/wikiproc/R/get_data.R
index 1050189120a85492d34b8dda19d6ff414db55b6f..24ffb1df148ead2457fc83576bbce3ad1852f677 100644
--- a/processing/wikiproc/R/get_data.R
+++ b/processing/wikiproc/R/get_data.R
@@ -37,7 +37,11 @@ get_data <- function(use.cache = TRUE, write.cache = FALSE, data.dir = "data") {
   cat("Downloading list from wikipedia... ")
+<<<<<<< HEAD:processing/wikiproc/R/get_data.R
   page <- xml2::read_html("https://en.wikipedia.org/wiki/List_of_physicists")
+  page <- read_html("https://en.wikipedia.org/wiki/List_of_physicists")
+>>>>>>> master:processing/wikiproc/R/get_data.R
@@ -46,8 +50,13 @@ get_data <- function(use.cache = TRUE, write.cache = FALSE, data.dir = "data") {
   cat("Processing data:\n")
   physicists <- page %>%
+<<<<<<< HEAD:processing/wikiproc/R/get_data.R
     rvest::html_nodes(".mw-parser-output li a") %>%
+    html_nodes(".mw-parser-output li a") %>%
+    html_attr("href")
+>>>>>>> master:processing/wikiproc/R/get_data.R
   # Clean the list
diff --git a/processing/wikiproc/R/nlp_annotate.R b/processing/wikiproc/R/nlp_annotate.R
index 98a3f320ed35aa5d0ed205b84dd51037755735d1..9a94958c7fd7e1019a3e7f6cd7a5649b60c1cb73 100644
--- a/processing/wikiproc/R/nlp_annotate.R
+++ b/processing/wikiproc/R/nlp_annotate.R
@@ -34,6 +34,7 @@ init_nlp <- function(type, value) {
 #' @return Annotation object for use with cleanNLP methods
 #' @export
 create_annotations <- function(text, article.id, article.rev.id, use.cache = TRUE, write.cache = FALSE, data.dir = "data") {
+<<<<<<< HEAD
   # Generate filename, for some reason there paste0 will pad the article id with leading whitespaces
   # To prevent this we stip 'em again
@@ -42,6 +43,16 @@ create_annotations <- function(text, article.id, article.rev.id, use.cache = TRU
   # Check if there is a cached version of the annotations for this article in this specific revision
+  # Generate filename, for some reason there paste0 will pad the article id with leading whitespaces
+  # To prevent this we stip 'em again
+  filename <- gsub(" ", "", paste(data.dir, "annotations", paste0(article.id, "-", article.rev.id, ".RDS"), sep = .Platform$file.sep), fixed = TRUE)
+  # Check if there is a cached version of the annotations for this article in this specific revision
+>>>>>>> master
   if(use.cache & file.exists(filename)) {
     res <- tryCatch({
       data <- readRDS(filename)
@@ -51,11 +62,19 @@ create_annotations <- function(text, article.id, article.rev.id, use.cache = TRU
+<<<<<<< HEAD
   annotation <- cleanNLP::cnlp_annotate(text, as_strings = TRUE)
   # Write cache if desired
+  annotation <- cleanNLP::cnlp_annotate(text, as_strings = TRUE)
+  # Write cache if desired
+>>>>>>> master
   if(write.cache) {
     if (!dir.exists("data")) {
@@ -65,6 +84,7 @@ create_annotations <- function(text, article.id, article.rev.id, use.cache = TRU
     saveRDS(annotation, filename)
+<<<<<<< HEAD
   # Return data
   # On a side note: Should we do this? The tidyverse style guide discourages explicit returns.
@@ -72,3 +92,12 @@ create_annotations <- function(text, article.id, article.rev.id, use.cache = TRU
+  # Return data
+  # On a side note: Should we do this? The tidyverse style guide discourages explicit returns.
+  # But then again, it suggests snake case for variables...
+  return(annotation)
+>>>>>>> master
diff --git a/processing/wikiproc/tests/testthat/article-4-cleansed.txt b/processing/wikiproc/tests/testthat/article-4-cleansed.txt
index 339f780a2ebaa0fd57d2a878abcf24d4a01c689f..499e8b869b6cbad18d7c08093396be04a9743916 100644
--- a/processing/wikiproc/tests/testthat/article-4-cleansed.txt
+++ b/processing/wikiproc/tests/testthat/article-4-cleansed.txt
@@ -13,4 +13,7 @@ According to a 2008 article, "Academician Abdullayev was called the Father of Ph
 Academician Abdullayev was recognized as the top expert on the chemical element selenium, and thus entrusted authoring the article on selenium in the third (final) edition of the top scientific reference publication - the Great Soviet Encyclopedia. Original quote in Russian: "Модель с использованием структуры с p−n-переходом для объяснения выпрямления в селеновых выпрямителях предлагалась Д.Н. Наследовым и Г.Б. Абдуллаевым. Несмотря на многочисленные исследования, теория функционирования полупроводниковых выпрямителей на основе закиси меди и селена в течение многих лет не была создана."
 Original quote in Russian: "Начиная с 1960-года, и примерно до 1987 года в Баку я был много раз. Затем приезжал сюда в 2003 году, принять участие в праздновании 85 лет со дня рождения моего друга, покойного президента Азербайджанской академии наук Гасана Багировича Абдуллаева. Тогда же я побывал в Институте физики Академии наук Азербайджана. Обрадовался, что он сохранился.... Но дело в том, что и в советское время азербайджанцам было нелегко иметь достаточно прочные позиции, не то, чтобы в мировой, но и в советской науке. Г. Абдуллаев был очень талантливым физиком. Он понимал, что физика полупроводников - широкая область. Для развития промышленности нужно развивать многое. Но в целом Институт должен иметь свое лицо. И он его создал - это слоистые полупроводники на основе селена, которые нашли массу применений в опцеэлектронике, в оптике. И это очень хорошо. Люди на этом росли и развивались. Появился целый ряд отраслевых организаций. Я не могу сказать как обстоят дела с физикой в Азербайджане сегодня, но думаю, что они далеки от благополучия."
 Original quote from the Great Soviet Encyclopedia in Russian: "Большой вклад в создание Полупроводниковой электроники внесли советские учёные — физики и инженеры (А. Ф. Иоффе, Н. П. Сажин, Я. И. Френкель, Б. М. Вул, В. М. Тучкевич, Г. Б. Абдулаев, Ж. И. Алферов, К. А. Валиев, Ю. П. Докучаев, Л. В. Келдыш, С. Г. Калашников, В. Г. Колесников, А. В. Красилов, В. Е, Лашкарёв, Я. А. Федотов и многие др.)." А. И. Шокин. Полупроводниковая электроника. Большая советская энциклопедия. — М.: Советская энциклопедия 1969—1978.
+<<<<<<< HEAD
+>>>>>>> master
diff --git a/processing/wikiproc/tests/testthat/test-clean_html.R b/processing/wikiproc/tests/testthat/test-clean_html.R
index 764103572428c4013637196589a452e65d75c33b..084e9b3cb77c0b9eade4a114de4f985652e1572d 100644
--- a/processing/wikiproc/tests/testthat/test-clean_html.R
+++ b/processing/wikiproc/tests/testthat/test-clean_html.R
@@ -4,8 +4,13 @@ test_that("html cleansing works", {
   filename_raw <- "article-4-raw.html"
   filename_cleansed <- "article-4-cleansed.txt"
   html <- readChar(filename_raw, file.info(filename_raw)$size)
+<<<<<<< HEAD
   expected <- gsub("\\s", "", readChar(filename_cleansed, file.info(filename_cleansed)$size))
   actual <- gsub("\\s", "", clean_html(html))
+  expected <- readChar(filename_cleansed, file.info(filename_cleansed)$size)
+  actual <- clean_html(html)
+>>>>>>> master
   expect_equal(expected, actual)