Iklan

Perhitungan Somers’ D, Goodman-Kruskal Gamma, Kendall’s Tau-a Pada Regresi Logit


Seorang pengunjung blog ini (Dian) bertanya sebagai berikut:

Salam.
Pak,saya  sedang olah data menggunakan logit. Hasil yang saya peroleh nilai somers’d, goodman-kruskal gamma, dan kendall’s tau-a masing-masing  adalah 0.83, 0.84, & 0.30

Pertanyaannya:
1. Apa nilai-nilai  tersebut sudah bisa mengatakan bahwa model saya bagus Pak? Nilai Somers’d dan goodmn-kruskal gamma memang mendekati angka1, namun nilai kendall’s tau-a jauh dari 1..
2. Sebenarnya maksud dari nilai-nilai tersebut sebagai  ringkasan asosiasi tabel concordant&discordant itu apa ya Pak? Apa interpretasi untuk masing-masing nilai (somer’s D,goodmn-krskl gamma,&kendall’s tau-a).
3. Apakah ada indikator atau batasan nilai yang pasti untuk somers’d,goodman-kruskal gamma,&kendall’s tau-a, jika dikatakan daya prediksi model bagus dan tidak bagus?soalnya dari penjelasan hanya dikatakan semakin mendekati 1 berarti semakin baik..jadi tidak ada batas bawahnya yang pasti.
4. Apa kelebihan olah data logit menggunakan minitab dibandingkan dengan spss?

Wuih. Pertanyaannya banyak sekali. Tapi ndak apa-apa. Saya senang karena hal tersebut juga menunjukkan adanya respons yang baik terhadap tulisan-tulisan dalam blog ini.

Baiklah, untuk pertanyaan 1 – 3 akan dijawab dalam tulisan ini. Pertanyaan keempat akan dijawab pada tulisan berikutnya (biar tidak terlalu panjang postingannya)

Ketika kita menggunakan regresi logit pada Minitab, salah satu output yang didapatkan adalah ukuran asosiasi antara variabel respons (variabel terikat) dengan probabilita prediksi dari variabel respons tersebut. Ukuran-ukuran tersebut adalah ringkasan dari tabel concordant, discordant, ties, yaitu Somer’s D,  Goodman-Kruskal Gamma, Kendall’s Tau-a.

Apa makna dari masing-masing ukuran tersebut dan bagaimana menghitungnya ?

Untuk memperjelasnya, mari kita lihat contoh berikut:

Misalnya, kita ingin meregresikan umur  (X) terhadap keputusan membeli mobil (Y). Umur dalam satuan tahun dan keputusan membeli mobil  dalam bentuk variabel dummy ( 1 = membeli mobil, 0 = tidak membeli mobil). Misalnya kita punya data sebanyak 15 responden sebagai berikut:

somer1

Output minitab untuk regresi binary logitnya sebagai berikut: (agar lebih fokus, hanya ditampilkan bagian yang akan dibahas. Untuk  mengetahui prosedur penggunaan minitab silakan lihat tulisan sebelum ini)

somer2

Dari output tersebut, kita dapatkan persamaan regresi logistiknya sebagai berikut:

somer3

(Catatan: hati-hati menginterpretasikan persamaan ini. Lihat tulisan disini mengenai interpretasi tersebut)

Dimana P(xi) adalah peluang membeli mobil dan 1-P(xi) adalah peluang tidak membeli mobil.

Oleh karenanya, ln [P(xi)/1-P(xi)] secara sederhana merupakan log dari perbandingan antara peluang membeli mobil dengan peluang tidak membeli mobil. Oleh karenanya juga, koefisien dalam persamaan (0.18648) ini menunjukkan pengaruh dari umur terhadap peluang relative individu membeli mobil yang dibandingkan dengan peluang tidak membeli mobil.

Sekarang kita lihat bagian output Measures of Association, yang mengukur asosiasi/hubungan antara variabel response (variabel terikat) dengan prediksi probabilita dari variabel terikat tersebut.

Pertama-tama, kita lihat dulu pengertian Concordant, Discordant dan Ties dari output tersebut.

Secara definisi: suatu pasangan observasi adalah concordant jika observasi dengan nilai respons (variabel terikat) 1 mempunyai prediksi probabilita (berdasarkan model) yang lebih tinggi dibandingkan dengan nilai respons 0. Sebaliknya suatu pasangan observasi adalah discordant jika observasi dengan nilai respons  1 mempunyai prediksi probabilita yang lebih rendah dibandingkan dengan nilai respons 0. Selanjutnya, suatu pasangan adalah ties jika observasi  dengan nilai respons 1 mempunyai prediksi probabilita yang sama dengan nilai respons 0.

Bingung dengan definisi tersebut ? Mari kita hitung secara manual dan bertahap untuk mempermudahnya. Lihat tabel dibawah ini:

somer4

Kolom (1) adalah nilai Y, kolom (2) adalah nilai X.

Kolom (3) adalah prediksi probabilita dari masing-masing observasi kita. Bagaimana cara menghitungnya ? Masukkan masing-masing nilai X (umur) dalam persamaan regresi logistik diatas. Misalnya  untuk umur 60 (baris pertama), nilai g(x) = -6.386 + 0.18648(60) = 4.7978. Demikian seterusnya

Kolom (4) adalah rangking untuk g(x), dengan nilai terendah diberik ranking 1, dstnya.

Kolom (5) adalah nilai concordant. Untuk menghitungnya, bandingkan ranking g(x) pada observasi dengan nilai respons= 1 terhadap observasi dengan nilai respons=0, dan hitung berapa banyak ranking g(x) untuk observasi respons=0 yang lebih rendah dibandingkan observasi respons=1.

Misalnya untuk  baris pertama, ranking g(x)=15.  Ternyata seluruh observasi dengan respons=0 (ada 6 observasi) memiliki ranking lebih kecil dari 15. Sehingga pada baris pertama ini concordantnya = 6.

Misalnya untuk baris keempat, ranking g(x)=4. Sekarang perhatikan ranking g(x) untuk observasi dengan respons=0.  Ada tiga ranking yang berada dibawah ranking 4, yaitu 1, 1, dan 3. Dengan demikian concordant pada baris keempat ini adalah 3. Demikian seterusnya.

Kolom (6) adalah nilai discordant. Cara menghitungnya adalah kebalikan dari concordant. Dalam hal ini yang dicari adalah ranking yang lebih besar. Misalnya pada baris kesembilan, ranking g(x) = 6. Perhatikan ranking g(x) untuk respons=1. Ada dua ranking yang lebih besar dari 6 yaitu 7 dan 8. Sehingga discordant pada baris kesembilan ini adalah 2.

Kolom (7) adalah nilai ties. Cara menghitungnya dengan mencari ranking yang sama antara respons =1 dan respons=0.  Perhatikan pada baris keempat, ranking g(x) = 4. Pada respons=0 juga terdapat satu ranking yang bernilai 4, sehingga ties pada baris keempat ini adalah 1.

Concordant, Discordant dan Ties ini kemudian dijumlahkan untuk menghitung  Somer’s D,  Goodman-Kruskal Gamma, Kendall’s Tau-a.

Rumus masing-masingnya sebagai berikut:

Somers’ D           = (nc – nd) / (nc + nd + nt)

Goodman-Kruskal Gamma = (nc – nd) / (nc + nd)

Kendalls Tau-a   = (nc – nd) / (0.5 x N x (N-1))

dimana

nc           = jumlah concordant

nd           = jumlah discordant

nt            = jumlah ties

N             = banyaknya observasi

Dari tabel  perhitungan tadi, maka nilai masing-masingnya adalah sebagai berikut:

Somers D             = (49 – 4) / (49 + 4 + 1) = 0,83

Goodman-Kruskal Gamma = (49 – 4) / (49 + 4) = 0,85

Kendalls Tau-a   = (49 – 4) / (0.5 x 15 x (15-1)) = 0,43.

Beberapa catatan penting dari ketiga pengukuran ini adalah:

Somers’ D memperhitungkan ties dalam faktor pembaginya sedangkan Goodman-Kruskal Gamma mengabaikan (tidak mengikutkan dalam perhitungan) nilai ties ini. Sehingga ketika ada ties, nilai Somers’D akan lebih kecil dibandingkan Goodman-Kruskal Gamma. Tetapi ketika tidak ada ties, nilai Somers’ D akan sama dengan Goodman-Kruskal Gamma.

Oleh karenanya, jika data kita memiliki banyak ties, ukuran yang lebih cermat adalah menggunakan Somers D.

Berbeda dengan dua pengukuran lainnya, Kendalls Tau-a, menggunakan jumlah observasi sebagai faktor pembagi.  Berdasarkan rumus tersebut, semakin banyak observasi maka akansemakin kecil nilai Kendalls Tau-a (dengan asumsi proporsi  concordant, discordant dan ties tidak berubah). Oleh karenanya, penggunaan Kendalls Tau-a ini menurut saya lebih tepat digunakan pada sampel kecil.

Lalu bagaimana kita menginterpretasi nilai-nilai yang diperoleh ?

Sebagaimana jenis pengukuran asosiasi/korelasi lainnya, tidak ada patokan baku untuk menyatakan suatu nilai asosiasi/korelasi memiliki hubungan yang kuat (atau mungkin saya belum ketemu referensinya ya). Patokannya hanya, semakin mendekati 1 maka akan semakin kuat hubungan yang diuji.

Ada juga yang menyatakan kalau angkanya diatas 0,5 maka dianggap hubungannya sudah kuat (karena kalau rentang 0 – 1 kita bagi dua, jika lebih setengah dianggap sudah mendekati 1).

Ada juga yang menyatakan kalau angkanya diatas 0,7 baru dianggap hubungannya kuat. Dengan dalih, kalau korelasi tersebut dikuadratkan, maka akan mendapatkan koefisien determinasi diatas 0,5.

Kalau menurut saya, untuk menginterpretasikan kuat atau lemahnya suatu angka asosiasi/korelasi sangat bersifat kasuistis. Tergantung pada kasus yang akan diuji hubungannya tersebut.  Ini pendapat saya lho. Silakan cari referensi yang mungkin lebih mendukung.

Salam. Kita sambung pada tulisan berikutnya.

Iklan

3 Tanggapan

  1. bertanya pak !! uji somers. termasuk dalam tabel square (mis. BxK = 3×3) atau nonsquare (BxK = 5×4) ???

  2. ari.
    maaf pak, saya mau bertanya tentang logit. variabel indenvenya di transformasi data dulu tidak.
    terima kasih sebelumnya

  3. maaf, saya masih baru belajar, jadi saya masih bingung bagaimana mendapatkan nilai hasil concordant dan dis?judul penelitian saya, hubungan antara motivasi belajar dan minat belajar dengan prestasi belajar mahasiswa.

    Kalau secara manual, seperti tulisan diatas. Kalau pakai software minitab, biasanya langsung keluar hasilnya.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

%d blogger menyukai ini: