Analisis Regresi Logitik Multinomial Menggunakan R
Analisis Regresi Logitik Multinomial Menggunakan R
Penulis: Putri Dina Sari
Pengertian Regresi Logistik Multinomial
Regresi logistik multinomial atau disebut juga model logit politomus adalah sebuah analisis regresi untuk menyelesaikan masalah dimana variabel terikatnya mempunyai kategori lebih dari dua kategori.
Menurut Agresti (2001), model peluang variabel terikat
Variabel terikat
dengan
Model logit merupakan transformasi logit dari
Pendugaan Parameter Model Regresi Logistik Multinomial
Pendugaan parameter model regresi logistik multinomial dilakukan dengan metode maksimum likelihood (maximum likelihood estimation). Prinsip utama dari metode maksimum likelihood adalah mencari
Uji Signifikansi Model Regresi Logistik Multinomial
Untuk memeriksa signifikansi parameter yang telah diestimasi adalah dengan melakukan pengujian terhadap parameter model tersebut. Pengujian dilakukan pada koefisien
- Pengujian Secara Simultan
Pengujian secara simultan merupakan pengujian secara bersama-sama pengaruh variabel bebas terhadap variabel terikat. Hipotesis yang digunakan adalah sebagai berikut.
Statistik uji yang digunakan adalah statistik uji rasio likelihood (likelihood ratio test) G,
Statistik
- Pengujian Secara Parsial
Pengujian ini dilakukan untuk mengetahui pengaruh variabel bebas secara sendiri-sendiri terhadap variabel terikat. Pengujian signifikansi parameter menggunakan uji wald.
Hipotesis yang digunakan adalah sebagai berikut :
dengan
Statistik uji yang digunakan adalah uji wald sebagai berikut :
dengan
Kriteria pengujian,
Interprestasi Parameter Regresi Logistik Multinomial
Interprestasi model dilakukan dengan menggunakan Odds ratio. Odds ratio adalah ukuran asosiasi yang memperkirakan berapa besar kemungkinan variabel-variabel bebas terhadap variabel respon (Hosmer dan Lemeshow, 2000). Odds ratio untuk
Sehingga jika
Ukuran
Aplikasi Regresi Logistik Multinomial
Data
Data untuk contoh ini adalah data pilihan maskapai oleh konsumen di Bandara Depati Amir, Pangkal Pinang sebanyak 125 responden dan 3 variabel. Dari data ini akan dilihat faktor-faktor apakah yang mempengaruhi pilihan maskapai (Y) oleh konsumen berdasarkan 3 variabel bebas (X). Berikut adalah deskripsi dari data pilihan Maskapai
Tahapan Analisis Regresi Logistik Multinomial dengan menggunakan Software R
Langkah pertama adalah melakukan import data dari excel ke R. Sintak yang digunakan adalah sebagai berikut :
Akan muncul tampilan berikut:
Langkah kedua adalah melakukan eksplorasi data dengan melihat variabel serta tipe dari
variabel yang digunakan, apakah sudah cocok atau belum.
Akan ditampilkan output berikut:
Dari output diatas tampak bahwa tipe variabel Y masih berupa numerik (interger). Oleh karena itu variabel Y tersebut perlu diubah menjadi variabel yang berupa kategorik.
Langkah ketiga adalah mengganti tipe variabel
Akan ditampilkan output berikut:
Langkah keempat yaitu membentuk model multinom. Sebelum membentuk model maka terlebih dahulu perlu di isntall beberapa package yang digunakan di dalam R untuk membentuk model multinom. Apa itu package? Package (library) yaitu suatu kumpulan perintah atau fungsi yang dapat digunakan untuk melakukan analisis tertentu. Dalam kasus ini package yang digunakan seperti “foreign, nnet, caret, dan e1071”. Setelah dilakukan penginstallan maka langkah selanjutnya baru dilakukan analisis regresi logistik multinomial berikut:
Output yang dihasilkan adalah sebagai berikut:
Dari output diatas pada Bagian
Converged -2log Likelihood menerangkan bahwa tanpa memasukkan variabel independen (intercept only) nilainya -117.4129 Namun dengan memasukkan variabel independen ke model (final) terjadi penurunan nilai menjadi -105.7805. Perubahan nilai ini merupakan nilai chi-square (Uji G). Nilai uji G yaitu 23.26 >
Kemudian untuk mengetahui pengaruh masing-masing variabel bebas terhadap variabel independen maka dapat ditunjukkan melalui nilai p (p-value) uji Wald. Sebagai contoh berdasarkan output diatas tampak bahwa untuk pilihan pesawat garuda indonesia (Y=2), variabel ketepatan jadwal penerbangan (X1) dan variabel pelayanan (X2) memiliki pengaruh yang signifikan sedangkan untuk variabel keamanan (X3) tidak memiliki pengaruh yang signifikan
Selanjutnya untuk kepentingan uji kebaikan model (goodness of fit), maka dapat dilakukan dengan melihat nilai koefisien determinasi. Berdasarkan output diatas diperoleh beberapa ukuran dari koefisien determinasi (R square) diantaranya Nilai Mc Faden (0.099), Cox an Snell (0.169) dan Negelkerke (0.200). Adapun cara interpretasi dari masing-masing-masing koefisien determinasi adalah sama. Sebagai contoh, nilai koefisien Negelkerke (0.200) yang berarti bahwa sebesar 20 % keragaman dari pilihan maskapai oleh konsumen dapat dijelaskan oleh variabel ketepatan jadwal penerbangan, pelayanan dan keamanan sedangkan sisanya dijelaskan oleh variabel lain di luar model penelitian.
Kemudian berdasarkan ouput diatas juga dapat dituliskan model regresi logistik multinomialnya sebagai berikut:
- Fungsi logit untuk maskapai Garuda Indonesia (Y=1) adalah
- Fungsi logit untuk maskapai Sriwijaya Air (Y=1) adalah
Langkah kelima yaitu melakukan interpretasi koefisien dengan cara sebagai berikut
Hasil yang diperoleh adalah sebagai berikut
Dari output diatas tampak nilai OR dari masing-masing variabel. Sebagai contoh Interpretasi
Odds Ratio untuk Garuda indonesia (Y=2)
- Varibel Ketepatan yaitu 3.162
Artinya adalah semakin tinggi tingkat Ketepatan Jadwal Penerbangan yang dimiliki maskapai penerbangan maka peluang konsumen memilih masakapai Garuda Indonesia sebesar 1,959 kali lebih besar dari peluang memilih maskapai Lion & Citilink.
- Varibel Pelayanan yaitu 2.687
Artinya semakin tinggi tingkat Pelayanan pramugari maskapai Garuda Indonesia maka peluang konsumen memilih maskapai Garuda Indonesia sebesar 2.687 kali lebih besar dari peluang memilih maskapai Lion & Citilink.