Setup Menus in Admin Panel

swanstatistika02@gmail.com

Dataframe Menggunakan R

      Halo sobat SWAN kali ini, swanstatistics.com akan mengulas mengenai Dataframe Menggunakan yang merupakan struktur data yang berformat tabel. Seperti halnya matrix, data frame terdiri dari baris dan kolom (i,j). Perbedaan mendasar antara data frame dan matrix yaitu pada data frame dapat memuat lebih dari 1 jenis tipe data sedangkan pada matrix hanya memuat 1 tipe data. Untuk membuat suatu matrix dapat dibuat dengan perintah data.frame().
Misalkan akan dibuat sebuah data frame dari kumpulan vector
x = c(rep("one",5))
y = c(rep("two",5))
z = c(rep(3,5))
df1=data.frame(x,y)
df1
##     x   y
## 1 one two
## 2 one two
## 3 one two
## 4 one two
## 5 one two
df2= data.frame(x,y,z)
df2
##     x   y z
## 1 one two 3
## 2 one two 3
## 3 one two 3
## 4 one two 3
## 5 one two 3
Mengubah Matrix menjadi data frame dapat menggunakan sintaks as.data.frame()
m2<-matrix(c(1,3,2,5,-1,2,2,3,9),ncol=3,byrow=T)
dfm<-as.data.frame(m2)
dfm
##   V1 V2 V3
## 1  1  3  2
## 2  5 -1  2
## 3  2  3  9

Mengambil Elemen Data Frame

Mengakses element suatu dataframe mirip dengan mengambil data matrix, dapat menggunakan kurung siku [baris,kolom], dengan mengakses indeks dari baris atau kolom yang diinginkan. Misalkan mengambil baris pertama dan kolom pertama pada dataframe df2
df2[1,1]
## [1] one
## Levels: one
Mengambil baris pertama untuk seluruh kolom
df2[1,]
##     x   y z
## 1 one two 3
Jika menggunakan negatif index berarti tidak mengikut sertakan nilai pada index tersebut, baik baris maupun kolom
df2[-1,]                  
##     x   y z
## 2 one two 3
## 3 one two 3
## 4 one two 3
## 5 one two 3
df2[,-1]
##     y z
## 1 two 3
## 2 two 3
## 3 two 3
## 4 two 3
## 5 two 3
Cara lain untuk mengakses kolom atau mengambil variabel dengan menggunakan tanda $ , contoh:
df2$y
## [1] two two two two two
## Levels: two
df2$x
## [1] one one one one one
## Levels: one

Missing value

Dalam menangani missing value pada dataframe bisa dengan beberapa cara baik menghilangkan 1 baris yang memiliki nilai missing, ataupun dengan mengisi nilai yang hilang/kosong dengan nilai tertentu. Untuk menghilangkan baris yang memiliki data kosong bisa menggunakan fungsi na.omit , contoh:
xc=c(1,2,NA,3,5)
df3=data.frame(df2,xc)
df3
##     x   y z xc
## 1 one two 3  1
## 2 one two 3  2
## 3 one two 3 NA
## 4 one two 3  3
## 5 one two 3  5
df4=na.omit(df3)
df4
##     x   y z xc
## 1 one two 3  1
## 2 one two 3  2
## 4 one two 3  3
## 5 one two 3  5
Selain menghilangkan baris yang memiliki missing value, bisa juga menggunakan metode imputasi dengan mengisi nilai yang kosong dengan nilai tertentu, misalnya nilai 0 atau rataannya.
Contoh jika menggunakan nilai 0
df3[is.na(df3)]=0

Memfilter data frame

Kadangkala kita ingin mengambil nilai tertentu berdasarkan hasil filter pada variabel tertentu. Misalkan kita memiliki data seperti ini.
kategori=c("rendah","rendah","rendah",
           "sedang","sedang","sedang","tinggi","tinggi")
nilai=c(30,45,50,65,75,83,90,95)
dataku=data.frame(kategori,nilai)
dataku
##   kategori nilai
## 1   rendah    30
## 2   rendah    45
## 3   rendah    50
## 4   sedang    65
## 5   sedang    75
## 6   sedang    83
## 7   tinggi    90
## 8   tinggi    95
misalkan dilakukan filter berdasarkan variabel nilai
baru=subset(dataku,nilai>50)
baru
##   kategori nilai
## 4   sedang    65
## 5   sedang    75
## 6   sedang    83
## 7   tinggi    90
## 8   tinggi    95
misalkan dilakukan filter berdasarkan variabel kategori
baru2=subset(dataku,kategori=='rendah')
baru2
##   kategori nilai
## 1   rendah    30
## 2   rendah    45
## 3   rendah    50
Mei 28, 2021
Copyright © 2018 PT. Angsa Statistika Indonesia