
Analisis Regresi Logitik Multinomial Menggunakan R
Analisis Regresi Logitik Multinomial Menggunakan R
Penulis: Putri Dina Sari
Pengertian Regresi Logistik Multinomial
Regresi logistik multinomial atau disebut juga model logit politomus adalah sebuah analisis regresi untuk menyelesaikan masalah dimana variabel terikatnya mempunyai kategori lebih dari dua kategori.
Menurut Agresti (2001), model peluang variabel terikat adalah

Variabel terikat dengan
kategori akan membentuk persamaan logit sebanyak
. Bentuk umum model logit multinomial dengan
sebagai pembanding adalah sebagai berikut :

dengan
merupakan parameter untuk logit ke-
dan
Model logit merupakan transformasi logit dari dan dinotasikan dengan
(Hosmer dan Lemeshow, 2000).
Pendugaan Parameter Model Regresi Logistik Multinomial
Pendugaan parameter model regresi logistik multinomial dilakukan dengan metode maksimum likelihood (maximum likelihood estimation). Prinsip utama dari metode maksimum likelihood adalah mencari yang dapat memaksimumkan fungsi likelihood. Fungsi likelihood menyatakan peluang bersama dari data hasil observasi.
Uji Signifikansi Model Regresi Logistik Multinomial
Untuk memeriksa signifikansi parameter yang telah diestimasi adalah dengan melakukan pengujian terhadap parameter model tersebut. Pengujian dilakukan pada koefisien dari model yang telah diperoleh. Terdapat dua jenis pengujian terhadap parameter model, yaitu pengujian secara simultan dan pengujian secara parsial.
- Pengujian Secara Simultan
Pengujian secara simultan merupakan pengujian secara bersama-sama pengaruh variabel bebas terhadap variabel terikat. Hipotesis yang digunakan adalah sebagai berikut.
, artinya tidak terdapat pengaruh antara setiap variabel bebas
secara bersama-sama terhadap variabel
.
: Paling sedikit terdapat satu
, artinya terdapat pengaruh antara setiap variabel
secara bersama-sama terhadap variabel
.dengan
Statistik uji yang digunakan adalah statistik uji rasio likelihood (likelihood ratio test) G,

Statistik ini akan mengikuti sebaran
. Kriteria pengujian,
ditolak jika G
dengan
(Hosmer dan Lemeshow, 2000).
- Pengujian Secara Parsial
Pengujian ini dilakukan untuk mengetahui pengaruh variabel bebas secara sendiri-sendiri terhadap variabel terikat. Pengujian signifikansi parameter menggunakan uji wald.
Hipotesis yang digunakan adalah sebagai berikut :
, artinya tidak terdapat pengaruh antara variabel
terhadap variabel
, artinya terdapat pengaruh antara variabel
terhadap variabel
dengan
Statistik uji yang digunakan adalah uji wald sebagai berikut :

dengan
adalah penaksir dari
adalah taksiran standar error parameter.
Kriteria pengujian, ditolak jika
atau
dengan derajat bebas
.
Interprestasi Parameter Regresi Logistik Multinomial
Interprestasi model dilakukan dengan menggunakan Odds ratio. Odds ratio adalah ukuran asosiasi yang memperkirakan berapa besar kemungkinan variabel-variabel bebas terhadap variabel respon (Hosmer dan Lemeshow, 2000). Odds ratio untuk terhadap
yang dihitung pada dua nilai (misal
dan
) adalah sebagai berikut:

Sehingga jika maka
Ukuran selalu positif dan umumnya digunakan sebagai pendekatan risiko nisbi (relative risk). Untuk
=1 berarti bahwa
memiliki risiko yang sama dengan
untuk menghasilkan Y = j. Bila 1
berarti bahwa
memiliki risiko lebih tinggi
kali dari pada
, dan untuk 0
maka
memiliki risiko lebih kecil
kali dari pada
.
Aplikasi Regresi Logistik Multinomial
Data
Data untuk contoh ini adalah data pilihan maskapai oleh konsumen di Bandara Depati Amir, Pangkal Pinang sebanyak 125 responden dan 3 variabel. Dari data ini akan dilihat faktor-faktor apakah yang mempengaruhi pilihan maskapai (Y) oleh konsumen berdasarkan 3 variabel bebas (X). Berikut adalah deskripsi dari data pilihan Maskapai

Tahapan Analisis Regresi Logistik Multinomial dengan menggunakan Software R
Langkah pertama adalah melakukan import data dari excel ke R. Sintak yang digunakan adalah sebagai berikut :

Akan muncul tampilan berikut:
Langkah kedua adalah melakukan eksplorasi data dengan melihat variabel serta tipe dari

variabel yang digunakan, apakah sudah cocok atau belum.

Akan ditampilkan output berikut:
Dari output diatas tampak bahwa tipe variabel Y masih berupa numerik (interger). Oleh karena itu variabel Y tersebut perlu diubah menjadi variabel yang berupa kategorik.

Langkah ketiga adalah mengganti tipe variabel

Akan ditampilkan output berikut:

Langkah keempat yaitu membentuk model multinom. Sebelum membentuk model maka terlebih dahulu perlu di isntall beberapa package yang digunakan di dalam R untuk membentuk model multinom. Apa itu package? Package (library) yaitu suatu kumpulan perintah atau fungsi yang dapat digunakan untuk melakukan analisis tertentu. Dalam kasus ini package yang digunakan seperti “foreign, nnet, caret, dan e1071”. Setelah dilakukan penginstallan maka langkah selanjutnya baru dilakukan analisis regresi logistik multinomial berikut:
Output yang dihasilkan adalah sebagai berikut:

Dari output diatas pada Bagian
Converged -2log Likelihood menerangkan bahwa tanpa memasukkan variabel independen (intercept only) nilainya -117.4129 Namun dengan memasukkan variabel independen ke model (final) terjadi penurunan nilai menjadi -105.7805. Perubahan nilai ini merupakan nilai chi-square (Uji G). Nilai uji G yaitu 23.26 > dan signifikan pada taraf nyata 5%. Kesimpulannya adalah minimal ada satu variabel bebas yang berpengaruh terhadap variabel respon atau dengan kata lain model cocok dengan data.
Kemudian untuk mengetahui pengaruh masing-masing variabel bebas terhadap variabel independen maka dapat ditunjukkan melalui nilai p (p-value) uji Wald. Sebagai contoh berdasarkan output diatas tampak bahwa untuk pilihan pesawat garuda indonesia (Y=2), variabel ketepatan jadwal penerbangan (X1) dan variabel pelayanan (X2) memiliki pengaruh yang signifikan sedangkan untuk variabel keamanan (X3) tidak memiliki pengaruh yang signifikan
Selanjutnya untuk kepentingan uji kebaikan model (goodness of fit), maka dapat dilakukan dengan melihat nilai koefisien determinasi. Berdasarkan output diatas diperoleh beberapa ukuran dari koefisien determinasi (R square) diantaranya Nilai Mc Faden (0.099), Cox an Snell (0.169) dan Negelkerke (0.200). Adapun cara interpretasi dari masing-masing-masing koefisien determinasi adalah sama. Sebagai contoh, nilai koefisien Negelkerke (0.200) yang berarti bahwa sebesar 20 % keragaman dari pilihan maskapai oleh konsumen dapat dijelaskan oleh variabel ketepatan jadwal penerbangan, pelayanan dan keamanan sedangkan sisanya dijelaskan oleh variabel lain di luar model penelitian.
Kemudian berdasarkan ouput diatas juga dapat dituliskan model regresi logistik multinomialnya sebagai berikut:
- Fungsi logit untuk maskapai Garuda Indonesia (Y=1) adalah

- Fungsi logit untuk maskapai Sriwijaya Air (Y=1) adalah

Langkah kelima yaitu melakukan interpretasi koefisien dengan cara sebagai berikut

Hasil yang diperoleh adalah sebagai berikut
Dari output diatas tampak nilai OR dari masing-masing variabel. Sebagai contoh Interpretasi

Odds Ratio untuk Garuda indonesia (Y=2)
- Varibel Ketepatan yaitu 3.162
Artinya adalah semakin tinggi tingkat Ketepatan Jadwal Penerbangan yang dimiliki maskapai penerbangan maka peluang konsumen memilih masakapai Garuda Indonesia sebesar 1,959 kali lebih besar dari peluang memilih maskapai Lion & Citilink.
- Varibel Pelayanan yaitu 2.687
Artinya semakin tinggi tingkat Pelayanan pramugari maskapai Garuda Indonesia maka peluang konsumen memilih maskapai Garuda Indonesia sebesar 2.687 kali lebih besar dari peluang memilih maskapai Lion & Citilink.