Analisis Regresi Logitik Multinomial Menggunakan R

19 Aug 2020 imran Alwi 0 Pemrograman

Analisis Regresi Logitik Multinomial Menggunakan R

Penulis: Putri Dina Sari

Pengertian Regresi Logistik Multinomial

Regresi logistik multinomial atau disebut juga model logit politomus adalah sebuah analisis regresi untuk menyelesaikan masalah dimana variabel terikatnya mempunyai kategori lebih dari dua kategori.

Menurut Agresti (2001), model peluang variabel terikat adalah

Variabel terikat dengan kategori akan membentuk persamaan logit sebanyak . Bentuk umum model logit multinomial dengan sebagai pembanding adalah sebagai berikut :

dengan


merupakan parameter untuk logit ke-dan

Model logit merupakan transformasi logit dari dan dinotasikan dengan (Hosmer dan Lemeshow, 2000).

Pendugaan Parameter Model Regresi Logistik Multinomial

Pendugaan parameter model regresi logistik multinomial dilakukan dengan metode maksimum likelihood (maximum likelihood estimation). Prinsip utama dari metode maksimum likelihood adalah mencari yang dapat memaksimumkan fungsi likelihood. Fungsi likelihood menyatakan peluang bersama dari data hasil observasi.

Uji Signifikansi Model Regresi Logistik Multinomial

Untuk memeriksa signifikansi parameter yang telah diestimasi adalah dengan melakukan pengujian terhadap parameter model tersebut. Pengujian dilakukan pada koefisien dari model yang telah diperoleh. Terdapat dua jenis pengujian terhadap parameter model, yaitu pengujian secara simultan dan pengujian secara parsial.

  1. Pengujian Secara Simultan

Pengujian secara simultan merupakan pengujian secara bersama-sama pengaruh variabel bebas terhadap variabel terikat. Hipotesis yang digunakan adalah sebagai berikut.

, artinya tidak terdapat pengaruh antara setiap variabel bebas secara bersama-sama terhadap variabel .

: Paling sedikit terdapat satu , artinya terdapat pengaruh antara setiap variabel secara bersama-sama terhadap variabel .dengan

Statistik uji yang digunakan adalah statistik uji rasio likelihood (likelihood ratio test) G,

Statistik ini akan mengikuti sebaran. Kriteria pengujian, ditolak jika Gdengan (Hosmer dan Lemeshow, 2000).

  1. Pengujian Secara Parsial

Pengujian ini dilakukan untuk mengetahui pengaruh variabel bebas secara sendiri-sendiri terhadap variabel terikat. Pengujian signifikansi parameter menggunakan uji wald.

Hipotesis yang digunakan adalah sebagai berikut :

, artinya tidak terdapat pengaruh antara variabel terhadap variabel

, artinya terdapat pengaruh antara variabel terhadap variabel

dengan

Statistik uji yang digunakan adalah uji wald sebagai berikut :

dengan

adalah penaksir dari

adalah taksiran standar error parameter.

Kriteria pengujian, ditolak jika atau dengan derajat bebas.

Interprestasi Parameter Regresi Logistik Multinomial

Interprestasi model dilakukan dengan menggunakan Odds ratio. Odds ratio adalah ukuran asosiasi yang memperkirakan berapa besar kemungkinan variabel-variabel bebas terhadap variabel respon (Hosmer dan Lemeshow, 2000). Odds ratio untuk terhadap yang dihitung pada dua nilai (misal dan ) adalah sebagai berikut:

Sehingga jika maka

Ukuran selalu positif dan umumnya digunakan sebagai pendekatan risiko nisbi (relative risk). Untuk =1 berarti bahwa memiliki risiko yang sama dengan untuk menghasilkan Y = j. Bila 1 berarti bahwa memiliki risiko lebih tinggi kali dari pada , dan untuk 0maka memiliki risiko lebih kecil kali dari pada .

Aplikasi Regresi Logistik Multinomial

Data

Data untuk contoh ini adalah data pilihan maskapai oleh konsumen di Bandara Depati Amir, Pangkal Pinang sebanyak 125 responden dan 3 variabel. Dari data ini akan dilihat faktor-faktor apakah yang mempengaruhi pilihan maskapai (Y) oleh konsumen berdasarkan 3 variabel bebas (X). Berikut adalah deskripsi dari data pilihan Maskapai

Tahapan Analisis Regresi Logistik Multinomial dengan menggunakan Software R

Langkah pertama adalah melakukan import data dari excel ke R. Sintak yang digunakan adalah sebagai berikut :

Akan muncul tampilan berikut:

Langkah kedua adalah melakukan eksplorasi data dengan melihat variabel serta tipe dari

variabel yang digunakan, apakah sudah cocok atau belum.

Akan ditampilkan output berikut:

Dari output diatas tampak bahwa tipe variabel Y masih berupa numerik (interger). Oleh karena itu variabel Y tersebut perlu diubah menjadi variabel yang berupa kategorik.

Langkah ketiga adalah mengganti tipe variabel

Akan ditampilkan output berikut:

Langkah keempat yaitu membentuk model multinom. Sebelum membentuk model maka terlebih dahulu perlu di isntall beberapa package yang digunakan di dalam R untuk membentuk model multinom. Apa itu package? Package (library) yaitu suatu kumpulan perintah atau fungsi yang dapat digunakan untuk melakukan analisis tertentu. Dalam kasus ini package yang digunakan seperti "foreign, nnet, caret, dan e1071". Setelah dilakukan penginstallan maka langkah selanjutnya baru dilakukan analisis regresi logistik multinomial berikut:

Output yang dihasilkan adalah sebagai berikut:

Dari output diatas pada Bagian
Converged -2log Likelihood menerangkan bahwa tanpa memasukkan variabel independen (intercept only) nilainya -117.4129 Namun dengan memasukkan variabel independen ke model (final) terjadi penurunan nilai menjadi -105.7805. Perubahan nilai ini merupakan nilai chi-square (Uji G). Nilai uji G yaitu 23.26 > dan signifikan pada taraf nyata 5%. Kesimpulannya adalah minimal ada satu variabel bebas yang berpengaruh terhadap variabel respon atau dengan kata lain model cocok dengan data.

    Kemudian untuk mengetahui pengaruh masing-masing variabel bebas terhadap variabel independen maka dapat ditunjukkan melalui nilai p (p-value) uji Wald. Sebagai contoh berdasarkan output diatas tampak bahwa untuk pilihan pesawat garuda indonesia (Y=2), variabel ketepatan jadwal penerbangan (X1) dan variabel pelayanan (X2) memiliki pengaruh yang signifikan sedangkan untuk variabel keamanan (X3) tidak memiliki pengaruh yang signifikan

    Selanjutnya untuk kepentingan uji kebaikan model (goodness of fit), maka dapat dilakukan dengan melihat nilai koefisien determinasi. Berdasarkan output diatas diperoleh beberapa ukuran dari koefisien determinasi (R square) diantaranya Nilai Mc Faden (0.099), Cox an Snell (0.169) dan Negelkerke (0.200). Adapun cara interpretasi dari masing-masing-masing koefisien determinasi adalah sama. Sebagai contoh, nilai koefisien Negelkerke (0.200) yang berarti bahwa sebesar 20 % keragaman dari pilihan maskapai oleh konsumen dapat dijelaskan oleh variabel ketepatan jadwal penerbangan, pelayanan dan keamanan sedangkan sisanya dijelaskan oleh variabel lain di luar model penelitian.

Kemudian berdasarkan ouput diatas juga dapat dituliskan model regresi logistik multinomialnya sebagai berikut:

  • Fungsi logit untuk maskapai Garuda Indonesia (Y=1) adalah

  • Fungsi logit untuk maskapai Sriwijaya Air (Y=1) adalah

Langkah kelima yaitu melakukan interpretasi koefisien dengan cara sebagai berikut

Hasil yang diperoleh adalah sebagai berikut

Dari output diatas tampak nilai OR dari masing-masing variabel. Sebagai contoh Interpretasi

Odds Ratio untuk Garuda indonesia (Y=2)

  • Varibel Ketepatan yaitu 3.162

Artinya adalah semakin tinggi tingkat Ketepatan Jadwal Penerbangan yang dimiliki maskapai penerbangan maka peluang konsumen memilih masakapai Garuda Indonesia sebesar 1,959 kali lebih besar dari peluang memilih maskapai Lion & Citilink.

  • Varibel Pelayanan yaitu 2.687

Artinya semakin tinggi tingkat Pelayanan pramugari maskapai Garuda Indonesia maka peluang konsumen memilih maskapai Garuda Indonesia sebesar 2.687 kali lebih besar dari peluang memilih maskapai Lion & Citilink.

    

BY: imran Alwi

Artikel terkait

Belum ada komentar, Jadilah yang pertama mengomentari.