Analisis Regresi Logitik Multinomial Menggunakan R
Analisis Regresi Logitik Multinomial Menggunakan R
Penulis: Putri Dina Sari
Pengertian Regresi Logistik Multinomial
Regresi logistik multinomial atau disebut juga model logit politomus adalah sebuah analisis regresi untuk menyelesaikan masalah dimana variabel terikatnya mempunyai kategori lebih dari dua kategori.
Menurut Agresti (2001), model peluang variabel terikat adalah
Variabel terikat dengan kategori akan membentuk persamaan logit sebanyak . Bentuk umum model logit multinomial dengan sebagai pembanding adalah sebagai berikut :
dengan
merupakan parameter untuk logit ke-dan
Model logit merupakan transformasi logit dari dan dinotasikan dengan (Hosmer dan Lemeshow, 2000).
Pendugaan Parameter Model Regresi Logistik Multinomial
Pendugaan parameter model regresi logistik multinomial dilakukan dengan metode maksimum likelihood (maximum likelihood estimation). Prinsip utama dari metode maksimum likelihood adalah mencari yang dapat memaksimumkan fungsi likelihood. Fungsi likelihood menyatakan peluang bersama dari data hasil observasi.
Uji Signifikansi Model Regresi Logistik Multinomial
Untuk memeriksa signifikansi parameter yang telah diestimasi adalah dengan melakukan pengujian terhadap parameter model tersebut. Pengujian dilakukan pada koefisien dari model yang telah diperoleh. Terdapat dua jenis pengujian terhadap parameter model, yaitu pengujian secara simultan dan pengujian secara parsial.
- Pengujian Secara Simultan
Pengujian secara simultan merupakan pengujian secara bersama-sama pengaruh variabel bebas terhadap variabel terikat. Hipotesis yang digunakan adalah sebagai berikut.
, artinya tidak terdapat pengaruh antara setiap variabel bebas secara bersama-sama terhadap variabel .
: Paling sedikit terdapat satu , artinya terdapat pengaruh antara setiap variabel secara bersama-sama terhadap variabel .dengan
Statistik uji yang digunakan adalah statistik uji rasio likelihood (likelihood ratio test) G,
Statistik ini akan mengikuti sebaran. Kriteria pengujian, ditolak jika Gdengan (Hosmer dan Lemeshow, 2000).
- Pengujian Secara Parsial
Pengujian ini dilakukan untuk mengetahui pengaruh variabel bebas secara sendiri-sendiri terhadap variabel terikat. Pengujian signifikansi parameter menggunakan uji wald.
Hipotesis yang digunakan adalah sebagai berikut :
, artinya tidak terdapat pengaruh antara variabel terhadap variabel
, artinya terdapat pengaruh antara variabel terhadap variabel
dengan
Statistik uji yang digunakan adalah uji wald sebagai berikut :
dengan
adalah penaksir dari
adalah taksiran standar error parameter.
Kriteria pengujian, ditolak jika atau dengan derajat bebas.
Interprestasi Parameter Regresi Logistik Multinomial
Interprestasi model dilakukan dengan menggunakan Odds ratio. Odds ratio adalah ukuran asosiasi yang memperkirakan berapa besar kemungkinan variabel-variabel bebas terhadap variabel respon (Hosmer dan Lemeshow, 2000). Odds ratio untuk terhadap yang dihitung pada dua nilai (misal dan ) adalah sebagai berikut:
Sehingga jika maka
Ukuran selalu positif dan umumnya digunakan sebagai pendekatan risiko nisbi (relative risk). Untuk =1 berarti bahwa memiliki risiko yang sama dengan untuk menghasilkan Y = j. Bila 1 berarti bahwa memiliki risiko lebih tinggi kali dari pada , dan untuk 0maka memiliki risiko lebih kecil kali dari pada .
Aplikasi Regresi Logistik Multinomial
Data
Data untuk contoh ini adalah data pilihan maskapai oleh konsumen di Bandara Depati Amir, Pangkal Pinang sebanyak 125 responden dan 3 variabel. Dari data ini akan dilihat faktor-faktor apakah yang mempengaruhi pilihan maskapai (Y) oleh konsumen berdasarkan 3 variabel bebas (X). Berikut adalah deskripsi dari data pilihan Maskapai
Tahapan Analisis Regresi Logistik Multinomial dengan menggunakan Software R
Langkah pertama adalah melakukan import data dari excel ke R. Sintak yang digunakan adalah sebagai berikut :
Akan muncul tampilan berikut:
Langkah kedua adalah melakukan eksplorasi data dengan melihat variabel serta tipe dari
variabel yang digunakan, apakah sudah cocok atau belum.
Akan ditampilkan output berikut:
Dari output diatas tampak bahwa tipe variabel Y masih berupa numerik (interger). Oleh karena itu variabel Y tersebut perlu diubah menjadi variabel yang berupa kategorik.
Langkah ketiga adalah mengganti tipe variabel
Akan ditampilkan output berikut:
Langkah keempat yaitu membentuk model multinom. Sebelum membentuk model maka terlebih dahulu perlu di isntall beberapa package yang digunakan di dalam R untuk membentuk model multinom. Apa itu package? Package (library) yaitu suatu kumpulan perintah atau fungsi yang dapat digunakan untuk melakukan analisis tertentu. Dalam kasus ini package yang digunakan seperti “foreign, nnet, caret, dan e1071”. Setelah dilakukan penginstallan maka langkah selanjutnya baru dilakukan analisis regresi logistik multinomial berikut:
Output yang dihasilkan adalah sebagai berikut:
Dari output diatas pada Bagian
Converged -2log Likelihood menerangkan bahwa tanpa memasukkan variabel independen (intercept only) nilainya -117.4129 Namun dengan memasukkan variabel independen ke model (final) terjadi penurunan nilai menjadi -105.7805. Perubahan nilai ini merupakan nilai chi-square (Uji G). Nilai uji G yaitu 23.26 > dan signifikan pada taraf nyata 5%. Kesimpulannya adalah minimal ada satu variabel bebas yang berpengaruh terhadap variabel respon atau dengan kata lain model cocok dengan data.
Kemudian untuk mengetahui pengaruh masing-masing variabel bebas terhadap variabel independen maka dapat ditunjukkan melalui nilai p (p-value) uji Wald. Sebagai contoh berdasarkan output diatas tampak bahwa untuk pilihan pesawat garuda indonesia (Y=2), variabel ketepatan jadwal penerbangan (X1) dan variabel pelayanan (X2) memiliki pengaruh yang signifikan sedangkan untuk variabel keamanan (X3) tidak memiliki pengaruh yang signifikan
Selanjutnya untuk kepentingan uji kebaikan model (goodness of fit), maka dapat dilakukan dengan melihat nilai koefisien determinasi. Berdasarkan output diatas diperoleh beberapa ukuran dari koefisien determinasi (R square) diantaranya Nilai Mc Faden (0.099), Cox an Snell (0.169) dan Negelkerke (0.200). Adapun cara interpretasi dari masing-masing-masing koefisien determinasi adalah sama. Sebagai contoh, nilai koefisien Negelkerke (0.200) yang berarti bahwa sebesar 20 % keragaman dari pilihan maskapai oleh konsumen dapat dijelaskan oleh variabel ketepatan jadwal penerbangan, pelayanan dan keamanan sedangkan sisanya dijelaskan oleh variabel lain di luar model penelitian.
Kemudian berdasarkan ouput diatas juga dapat dituliskan model regresi logistik multinomialnya sebagai berikut:
- Fungsi logit untuk maskapai Garuda Indonesia (Y=1) adalah
- Fungsi logit untuk maskapai Sriwijaya Air (Y=1) adalah
Langkah kelima yaitu melakukan interpretasi koefisien dengan cara sebagai berikut
Hasil yang diperoleh adalah sebagai berikut
Dari output diatas tampak nilai OR dari masing-masing variabel. Sebagai contoh Interpretasi
Odds Ratio untuk Garuda indonesia (Y=2)
- Varibel Ketepatan yaitu 3.162
Artinya adalah semakin tinggi tingkat Ketepatan Jadwal Penerbangan yang dimiliki maskapai penerbangan maka peluang konsumen memilih masakapai Garuda Indonesia sebesar 1,959 kali lebih besar dari peluang memilih maskapai Lion & Citilink.
- Varibel Pelayanan yaitu 2.687
Artinya semakin tinggi tingkat Pelayanan pramugari maskapai Garuda Indonesia maka peluang konsumen memilih maskapai Garuda Indonesia sebesar 2.687 kali lebih besar dari peluang memilih maskapai Lion & Citilink.