-
Notifications
You must be signed in to change notification settings - Fork 1
/
load.R
90 lines (68 loc) · 3.02 KB
/
load.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
library(dplyr)
# LOAD DATA FROM https://datahub.io/dataset/rozpoctova-data
rozpocet <- readxl::read_excel("data/rozpoctovadata.xlsx")
names(rozpocet) <- c("rok", "mesic", "ucetni_stredisko",
"nakladove_stredisko", "rozdeleni",
"trida", "skupina", "podskupina",
"polozka", "skupina2", "oddil",
"pododdil", "paragraf", "ucetni_stredisko4",
"org", "suau", "synteticky_ucet", "analyticky_ucet",
"orj", "k_za_ucetni_jedn", "k_smb", "rozpocet_schvaleny",
"rozpocet_upraveny", "cerpano")
# EXPLORE ###########################################
glimpse(rozpocet)
summary(rozpocet)
nakladove_stredisko <- data.frame(table(rozpocet$nakladove_stredisko))
ucetni_stredisko <- data.frame(table(rozpocet$ucetni_stredisko))
ucetni_stredisko4 <- data.frame(table(rozpocet$ucetni_stredisko4))
rozdeleni <- data.frame(table(rozpocet$rozdeleni))
trida <- data.frame(table(rozpocet$trida))
polozka <- data.frame(table(rozpocet$polozka))
skupina <- data.frame(table(rozpocet$skupina))
skupina2 <- data.frame(table(rozpocet$skupina2))
podskupina <- data.frame(table(rozpocet$podskupina))
oddíl <- data.frame(table(rozpocet$oddil))
pododdíl <- data.frame(table(rozpocet$pododdil))
paragraf <- data.frame(table(rozpocet$paragraf))
org <- data.frame(table(rozpocet$org))
orj <- data.frame(table(rozpocet$orj))
suau <- data.frame(table(rozpocet$suau))
table(rozpocet$cerpano > 0)
table(rozpocet$cerpano < 0)
table(is.na(rozpocet$cerpano))
table(rozpocet$rozpocet_upraveny > 0)
table(rozpocet$rozpocet_upraveny < 0)
table(is.na(rozpocet$rozpocet_upraveny))
# CLEAN ############################################
# Odfiltrovat vedlejsi hospodarskou cinnost (same 0)
vhc <- c("MČ Brno - Bystrc - VHČ, Obecní byty",
"MČ Brno - Jundrov - VHČ, Obecní byty",
"MČ Brno - Královo Pole - VHČ Obecní byty",
"MČ Brno - sever - VHČ Poliklinika Lesná",
"MČ Brno - střed - VHČ Obecní byty",
"Nákladové středisko - Jídelna",
"Nákladové středisko - VHČ DPH")
rozpocet <- rozpocet %>%
filter(!nakladove_stredisko %in% vhc) %>%
mutate(ucetni_stredisko = ifelse(ucetni_stredisko == "Městská část Brno -Vinohrady",
"Městská část Brno - Vinohrady", ucetni_stredisko))
# Vytvorit sloupec ROK-MESIC-01
yearmonth <- function(year, month){
as.Date(sprintf("%s-%s-01", year, month))
}
rozpocet$rok_mesic <- yearmonth(rozpocet$rok, rozpocet$mesic)
# TODO
# agregovat radky, aby byly 3 sloupce s castkami
# prejmenovat na MU XXX
write.csv(rozpocet, "data/rozpocet.csv")
#### OTHER
ucetni_stredisko <- rozpocet %>%
group_by(ucetni_stredisko, ucetni_stredisko4) %>%
summarise()
upraveny_rozpocet <- rozpocet %>%
filter(rozpocet_schvaleny != rozpocet_upraveny)
rozdeleni_bez_zarazeni <- rozpocet %>%
filter(rozdeleni == "Bez zařazení")
ucetni_nakladove <- rozpocet %>%
group_by(ucetni_stredisko, nakladove_stredisko) %>%
summarise()