středa 6. listopadu 2013

R - spotřeba automobilu

spotreba.csv



spotreba
11
16
5
4
8
10
5
13
9
11
7
4
4
6
14
4
15
6
7
8
11
9
13
15
14
10
16
9
9
9
13


setwd("nějaký adresář")
auta=read.table("spotreba.csv", header=TRUE)

spotreba=auta$spotreba
summary(spotreba)
minimum = min(spotreba)
maximum = max(spotreba)

tisk =c(minimum, maximum)
names(tisk)=c("minimum", "maximum")
tisk

obor.hodnot=range(spotreba)
obor.hodnot

absCet=table(spotreba)
relCet = prop.table(absCet)
procenta = 100 *  relCet
kumul.relCet = cumsum(relCet)
kumul.procenta=cumsum(procenta)
ukazat=rbind(absCet, relCet, procenta, kumul.relCet, kumul.procenta)
print(ukazat, digits=2)

barplot(relCet, xlab = "Spotreba (l/100 km)", ylab = "Relativni cetnost")

hist(spotreba, freq = TRUE, xlab = "Spotreba (l/100 km)", ylab = "Cetnost")
hist(spotreba, prob = TRUE, xlab = "Spotreba (l/100 km)", ylab = "Hustota")


Empirická distribuční funkce
plot(ecdf(spotreba))


Histogramy pro různě jemná dělení souboru
hist(spotreba, breaks=seq(0,20, by=10))
hist(spotreba, breaks=seq(0,20, by=2))


Kvartily (% počet aut majících spotřebu nižší než  uvedené hodnota)
kvartily=quantile(spotreba, probs=c(0.25,0.75))
percentily =quantile(spotreba, probs=seq(0,1,by=0.1))
quantile(spotreba, probs=c(0.25,0.5,0.75, seq(0,1,by=0.1))
median(spotreba)
prumer=mean(spotreba)
smerOdch=sd(spotreba)
rozptyl=var(spotreba)
variacKoef=smerOdch/prumer
ukazat=c(prumer, smerOdch, rozptyl, variacKoef)
names(ukazat)=c("Prumer","Směr. odchylka", "Rozptyl", "Variac. koef")
ukazat


Počty v intervalu x+-sd (x+-2sd)
n=length(spotreba)
sum(abs(spotreba-prumer)<smerOdch)
sum(abs(spotreba-prumer)<2*smerOdch)
pocet2=sum(abs(spotreba-prumer)<smerOdch
pocet3=sum(abs(spotreba-prumer)<2*smerOdch)
ukazat=round(pocet2/n,pocet3/n,2)
names(ukazat) = c("<sd","<2*sd")
ukazat

boxplot(spotreba)


Žádné komentáře:

Okomentovat