R. Sagedus- ja jaotustabel

Sisukas tabel
Sisukas tabel ilusamini
Sisukas tabel perfektselt

Sisukas tabel

 perekonnaseisF arv    osakaal  UIalumine  UIylemine Kum.Osakaal
      vallaline 579 87.5945537 84.8369500 90.0107673    87.59455
        abielus  17  2.5718608  1.5051818  4.0859405    90.16641
    vabaabielus  61  9.2284418  7.1325424 11.6964731    99.39486
      lahutatud   4  0.6051437  0.1651201  1.5421061   100.00000
           lesk   0  0.0000000  0.0000000  0.5565212   100.00000

Ülaltoodud tabeli tekitas alltoodud programm:

# Tekitame dekodeeritud väärtustega tunnuse
# Eesmärgiks pole mitte ainult parandada tabeli loetavust,
# vaid ka soov saada tabelisse read kõigi vastusevariantide kohta.
# Ilma selle käsuta jääks sagedustabelist välja leskede rida,
# sest valimisse juhuslikult ei sattunud ühtegi leske.
perekonnaseisF=factor(perekonnaseis, levels=1:5,
    c("vallaline", "abielus", "vabaabielus",
      "lahutatud", "lesk"))

# Leiame sagedus- ja jaotustabeli
a=table(perekonnaseisF)
b=prop.table(a)*100

# Arvutame 95%-usaldusintervallid kõigi
# väärtuste esinemisprotsentidele
UIalumine=rep(NA, length(a))
UIylemine=rep(NA, length(a))
for (i in 1:length(a)){
   UI=binom.test(a[i], sum(a))$conf.int*100
   UIalumine[i]=UI[1]
   UIylemine[i]=UI[2]
}


# Paneme ühte tabelisse kokku sagedustabeli, 
# jaotustabeli, leitud 95% usaldusintervalli ja lisame
# nalja pärast veel lõppu kumulatiivsete osakaalude tabeli
tabel=data.frame(
   a,
   osakaal=as.vector(b),
   UIalumine, UIylemine,
   Kum.Osakaal=cumsum(b)
)

# Muudame tekkiva tabeli teise rea pealkirja meelepärasemaks
colnames(tabel)[2]="arv"

# Trükime saadud tabeli välja (ilma reanimedeta) 
print(tabel, row.names=F)

Ümmardamine

 perekonnaseisF arv osakaal UIalumine UIylemine Kum.Osakaal
      vallaline 579    87.6      84.8      90.0        87.6
        abielus  17     2.6       1.5       4.1        90.2
    vabaabielus  61     9.2       7.1      11.7        99.4
      lahutatud   4     0.6       0.2       1.5       100.0
           lesk   0     0.0       0.0       0.6       100.0

Ülaltoodud tabeli tekitas alltoodud programm:

# Tekitame dekodeeritud väärtustega tunnuse
# Eesmärgiks pole mitte ainult parandada tabeli loetavust,
# vaid ka soov saada tabelisse read kõigi vastusevariantide kohta.
# Ilma selle käsuta jääks sagedustabelist välja leskede rida,
# sest valimisse juhuslikult ei sattunud ühtegi leske.
perekonnaseisF=factor(perekonnaseis, levels=1:5,
    c("vallaline", "abielus", "vabaabielus",
      "lahutatud", "lesk"))

# Leiame sagedus- ja jaotustabeli
a=table(perekonnaseisF)
b=prop.table(a)*100

# Arvutame 95%-usaldusintervallid kõigi
# väärtuste esinemisprotsentidele
UIalumine=rep(NA, length(a))
UIylemine=rep(NA, length(a))
for (i in 1:length(a)){
   UI=binom.test(a[i], sum(a))$conf.int*100
   UIalumine[i]=UI[1]
   UIylemine[i]=UI[2]
}


# Paneme ühte tabelisse kokku sagedustabeli, 
# jaotustabeli, leitud 95% usaldusintervalli ja lisame
# nalja pärast veel lõppu kumulatiivsete osakaalude tabeli
tabel=data.frame(
   a,
   osakaal=round(as.vector(b), 1),
   UIalumine=round(UIalumine,1),UIylemine=round(UIylemine,1),
   Kum.Osakaal=round(cumsum(b),1)
)


# Muudame tekkiva tabeli teise rea pealkirja meelepärasemaks
colnames(tabel)[2]="arv"

# Trükime saadud tabeli välja (ilma reanimedeta) 
print(tabel, row.names=F)

Hoolikalt vormindatud tabeli näide

perekonnaseisF arv osakaal            UI95 kum.osak.
       vallaline 579   87,6% (84,8%...90,0%)     87,6%
         abielus 17    2,6% (1,5%....4,1%)     90,2%
     vabaabielus 61    9,2% (7,1%...11,7%)     99,4%
       lahutatud   4    0,6% (0,2%....1,5%)    100,0%
            lesk   0    0,0% (0,0%....0,6%)    100,0%

Sunnime R'i vormistama sagedustabeli eesti tavadele vastavalt - nii et komad oleksid ikkagi komad (2,3) mitte R-i poolt tavaliselt kasutatavad punktid (2.3)!

Programm on pigem mõeldud tarvitamiseks olukorras, kus on regulaarselt (näiteks igapäevaselt, peale uute vaatluste lisandumist) tarvis tekitada kena väljanägemisega tabeleid.

# Tekitame dekodeeritud väärtustega tunnuse
# Eesmärgiks pole mitte ainult parandada tabeli loetavust,
# vaid ka soov saada tabelisse read kõigi vastusevariantide kohta.
# Ilma selle käsuta jääks sagedustabelist välja leskede rida,
# sest valimisse juhuslikult ei sattunud ühtegi leske.
perekonnaseisF=factor(perekonnaseis, levels=1:5,
    c("vallaline", "abielus", "vabaabielus",
      "lahutatud", "lesk"))

# Leiame sagedus- ja jaotustabeli
a=table(perekonnaseisF)
b=prop.table(a)*100

# Arvutame 95%-usaldusintervallid kõigi
# väärtuste esinemisprotsentidele
UIalumine=rep(NA, length(a))
UIylemine=rep(NA, length(a))
for (i in 1:length(a)){
   UI=binom.test(a[i], sum(a))$conf.int*100
   UIalumine[i]=UI[1]
   UIylemine[i]=UI[2]
}

# Vormistusa algus:
# Vormindame protsendid täpsusega 1 koht peale koma,
# kasutame komakohtade eraldajana eestipärast koma:
UIylemineTXT=formatC(UIylemine, digits=1,
   drop0trailing=FALSE, format="f",
   decimal.mark=",", width=5)

# Asendame arvu ees tühja ruumi punktidega "."
UIylemineTXT=gsub(" ", ".", UIylemineTXT)

# Vormistame usaldusintervalli väärtused kujule (10,2%...19,4%)
UItxt=paste(
   "(",
   formatC(UIalumine, digits=1, drop0trailing=FALSE,
     format="f", decimal.mark=","),
   "%..",
   UIylemineTXT,
   "%)",
sep="")

# Paneme ühte tabelisse kokku sagedustabeli, eestipäraselt
# vormindatud jaotustabeli, leitud 95% usaldusintervalli ja lisame
# nalja pärast veel lõppu kumulatiivsete osakaalude tabeli
tabel=data.frame(
   a,
   osakaal=paste(formatC(b,digits=1, format="f",
     decimal.mark=",", drop0trailing=FALSE), "%",
     sep=""),
   UI95=UItxt,
   kum.osak.=paste(formatC(cumsum(b),digits=1,
     format="f", decimal.mark=",",
     drop0trailing=FALSE), "%", sep="")
)

colnames(tabel)[2]="arv"
print(tabel, row.names=F)