library(readxl) library(lubridate) library(tidyverse) url1<-'https://svn.vsp.tu-berlin.de/repos/public-svn/matsim/scenarios/countries/de/episim/original-data/Abwasser/Biomarker_Monitoring_Koeln.xlsx' p1f <- tempfile() download.file(url1, p1f, mode="wb") Biomarker_Monitoring_Koeln <-read_excel(path = p1f, sheet = 1) colnames(Biomarker_Monitoring_Koeln) <- Biomarker_Monitoring_Koeln[1,] Biomarker_Monitoring_Koeln <- Biomarker_Monitoring_Koeln[-1,] Biomarker_Monitoring_Koeln <- Biomarker_Monitoring_Koeln %>% pivot_longer(Standort) %>% select(-c("Nr.", "name"), Standort = value) Biomarker_Monitoring_Koeln <- Biomarker_Monitoring_Koeln %>% mutate(Genommen = as.numeric(Genommen)) %>% mutate(Genommen = as.Date(Genommen, origin = "1899-12-30")) %>% mutate(Aufkonzentrierung = as.numeric(Aufkonzentrierung)) %>% mutate(Aufkonzentrierung = as.Date(Aufkonzentrierung, origin = "1899-12-30")) %>% mutate(`Ankunft Labor` = as.numeric(`Ankunft Labor`)) %>% mutate(`Ankunft Labor` = as.Date(`Ankunft Labor`, origin = "1899-12-30")) %>% mutate(`SARS-CoV-2 normiert` = as.numeric(`SARS-CoV-2 normiert`)) Biomarker_Monitoring_Koeln[, "Genommen"][is.na(Biomarker_Monitoring_Koeln[, "Genommen"])] <- as.Date("2022-09-05") Biomarker_Monitoring_Koeln[, "Aufkonzentrierung"][is.na(Biomarker_Monitoring_Koeln[, "Aufkonzentrierung"])] <- as.Date("2022-02-13") Biomarker_Monitoring_Koeln <- Biomarker_Monitoring_Koeln %>% mutate(week = week(Genommen), year = year(Genommen)) %>% group_by(year, week, Standort) %>% summarize(Genommen = max(Genommen), `Ankunft Labor` = max(`Ankunft Labor`), Aufkonzentrierung = max(Aufkonzentrierung), `AbwasserKonzentration` = mean(`SARS-CoV-2 normiert`)) %>% ungroup() Biomarker_Monitoring_Koeln <- Biomarker_Monitoring_Koeln %>% select(-c("year", "week")) ggplot(Biomarker_Monitoring_Koeln, aes(x=Aufkonzentrierung, y=AbwasserKonzentration, col =Standort)) + geom_line() + theme_minimal()