Iklan

Indeks Whipple: Evaluasi Pelaporan Umur Penduduk

Pada tulisan sebelumnya (lihat tulisan tersebut) kita telah melihat bahwa adanya kecenderungan orang untuk melaporkan umurnya pada umur-umur yang berakhiran angka 0 dan 5. Hal ini terdeteksi dari proporsi penduduk yang berumur dengan akhiran 0 dan 5 relatif lebih besar dibandingkan dengan umur sebelumnya dan dan umur sesudahnya.

Selain dengan cara pengamatan jumlah atau proporsi tersebut, kita bisa mendeteksi kesalahan pelaporan umur  dengan menggunakan Indeks Whipple (IW). Whipple mengevaluasi kesalahan yang disebabkan oleh pelaporan umur dengan anggapan bahwa kesalahan pelaporan umur sebagian besar terletak pada umur 23 tahun sampai dengan 62 tahun. Dalam pelaporannya, antara umur-umur tersebut banyak menyukai umur-umur yang berakhiran angka 0 dan 5.

Dengan dasar tersebut, Whipple kemudian merumuskan indeks kecermatan pelaporan umur dengan rumus:

Dari rumus tersebut terlihat bahwa indeks whipple dihitung dengan cara:  kalikan 5 jumlah  penduduk yang berumur dengan akhiran 0 dan 5 mulai dari umur 25 sampai 60. Selanjutnya dibagi dengan total jumlah penduduk yang berumur antara 23 sampai 62 tahun.

Jika semua penduduk yang berumur 23 sampai 62 tahun melaporkan umurnya berakhiran angka 0 atau 5, nilai indeks akan menjadi sebesar 500. Sebaliknya jika pelaporan umur antara 23 tahun sampai dengan 62 tahun tersebut benar, maka secara ringkas nilai indeks tersebut akan sama dengan 100. Dengan demikian, semakin dekat nilai indeks dengan 100, maka pelaporan umur makin mendekati kecermatan.

Sebagai contoh, kita kutipkan kembali data penduduk Provinsi Jambi tahun 2000 dari tulisan sebelumnya (hanya mulai umur 23 – 62 tahun), sebagai berikut:

Dari data tersebut, maka indeks whipplenya adalah:

Apa artinya ?

PBB merekomendasikan suatu standar untuk mengukur kesalahan pelaporan umur menggunakan indeks Whipple ini sebagai berikut:

Indeks Whipple Kualitas Data
< 105 Sangat akurat
105–110 Relatif akurat
110–125 OK
125–175 Buruk
> 175 Sangat buruk

Iklan

Age Heaping: Ternyata Kita Senang dengan Angka 0 dan 5

Ternyata secara tidak sadar, kita cenderung menyenangi angka 0 dan 5.  Kecenderungan kita menyenangi angka tersebut, menyebabkan kita cenderung melaporkan umur dengan umur-umur  yang berakhiran angka 0 dan 5. Ini menyebabkan terjadinya penumpukan penduduk pada umur-umur tersebut.

Secara normal, jumlah penduduk menurut umur satu tahunan atau umur tunggal  hanya berubah sedikit demi sedikit dari satu umur ke umur berikutnya. Tetapi kalau Anda perhatikan data distribusi umur penduduk di bawah ini, terlihat penumpukan umur pada umur-umur yang berakhiran 0 dan 5.  Sebagai contoh, pada umur 30 tahun proporsi penduduk mencapai 2,80 % sedangkan umur dibawahnya ( 29 tahun)  hanya sebesar 1,49 % dan umur diatasnya (31 tahun) hanya sebesar 1,27 %. Contoh lainnya pada umur 45 tahun, proporsi penduduk sebanyak 1,76 %, sedangkan pada umur dibawahnya (44 tahun) hanya 0,72 % dan diatasnya (46 tahun) hanya 0,65 %. Pola-pola semacam ini bisa Sdr. lihat pada umur-umur lainnya (yang berwarna merah).

Data ini memang data hasil Sensus Penduduk tahun 2000 untuk perdesaan Provinsi Jambi. Tapi fenomena ini  juga akan berlaku sama jika dilihat pada daerah-daerah lainnya.

Fenomena penumpukan umur ini dinamakan dengan “age heaping “.  Dan kesalahan-kesalahan dalam pelaporan umur penduduk ini akan berakibat kesalahan-kesalahan dalam berbagai analisis yang menggunakan data penduduk menurut umur ini. Oleh karenanya, kita perlu terlebih dahulu melakukan  evaluasi dan perapian data penduduk menurut umur ini sebelum digunakan untuk tujuan analisis tersebut.

Tulisan ini merupakan pengantar untuk seri metode evaluasi dan perapian data penduduk menurut umur. Kita akan  bahas metode-metode tersebut pada tulisan-tulisan berikutnya pada blog ini.

Lihat tulisan: Indeks Whipple: Evaluasi Pelaporan Umur Penduduk

Download Tabel r Lengkap

Buku ajar Statistika kadang-kadang melampirkan tabel r dalam rangka pengujian statistik (misalnya untuk pengujian validitas konstruk). Namun demikian, biasanya  tidak setiap nilai r untuk setiap derajat bebas yang dicantumkan. Oleh karenanya, kita sering kesulitan menentukan nilai r tabel ketika derajat bebas yang kita miliki tidak tercantum dalam tabel tersebut.

Oleh karenanya, berikut ini diberikan tabel r yang relatif lengkap, yang memuat tingkat signifikansi 0.1 , 0.5, 0.02, 0.01, 0.001. Selain itu, tabel ini juga memuat nilai r untuk derajat bebas mulai dari 1 – 200 secara berurut (lengkap).

Bagi yang membutuhkan, silakan klik disini

Cara Lebih Praktis Menghitung r Tabel dengan SPSS

Pada SPSS kita juga bisa menghitung nilai r tabel.  Berbagai sumber menyebutkan bahwa untuk menghitung nilai r tabel kita harus terlebih dahulu menghitung nilai t  tabel . Hal ini karena nilai t tabel dihasilkan dari rumus sebagai berikut:

Dimana: r = nilai r tabel, t = nilai t tabel dan df = derajat bebas

Berdasarkan rumus tersebut, maka  pada SPSS dilakukan tahapan sebagai berikut: (kita ikuti cara panjang ini sebelum melihat cara ringkas agar bisa memahami prosesnya)

1. Buka program SPSS, kemudian buat variabel baru dengan nama misalnya nama variabelnya adalah df. Klik disini jika belum memahami cara menginput data di SPSS

2. Kemudian isikan nilai derajat bebas (df) pada variabel tersebut. Terserah Sdr. mulai dari 1 sampai berapapun. Lihat contoh pada gambar berikut, misalnya dari df 1 – 5

3. Setelah itu klik Transform >  Compute Variable.  Akan muncul tampilan berikut: (hanya bagian yang penting yang ditampilkan)

Pada kotak isian Target Variable, isikan nama variabel untuk nilai t tabel yang akan kita hitung. Misalnya dalam contoh diatas kita beri nama t_0.05 (karena kita ingin menghitung t tabel dengan taraf signifikansi 5 %).

Pada kotak isian Numeric Expression: isikan rumus berikut:  IDF.T(0.95,df)

(Catatan: sebenarnya rumus tersebut bisa dibuat dengan menu dropdown, tapi tidak kita bahas disini).

Pada rumus diatas, angka pertama dalam kurung (sebelum tanda koma) yaitu 0.95 adalah tingkat/taraf keyakinan (level of confidence).  Taraf keyakinan ini  = 1 – α.  Nilai α (alpha) ini sendiri adalah tingkat/taraf signifikansi (level of significance). Jadi dalam contoh, misalnya kita ingin mencari nilai t tabel pada taraf signifikansi = 5 % (0.05), maka diisi pada rumus tersebut 1 – 0.05 = 0.95. (catatan: perhatikan perbedaannya dengan Excel. Pada rumus Excel, angka yang kita masukkan adalah langsung nilai α nya).

Selanjutnya, pada rumus diatas, setelah tanda koma adalah nama variabel tempat penyimpanan nilai derajat bebas yang telah kita tuliskan sebelumnya. Karena nama variabel yang kita buat sebelumnya adalah df, maka tulis df pada rumus tersebut.

4.  Setelah itu klik OK, maka akan muncul hasil sebagai berikut:

Kita sudah mendapatkan nilai t tabel. Sekarang lanjutkan pada tahap berikutnya dengan kembali meng klik Transform >  Compute Variable.  Akan muncul tampilan seperti pada tahapan 3. Tetapi sekarang pada kotak isian target variable kita tuliskan nama variabel untuk nilai r tabel yang akan kita hitung. Misalnya sebagai contoh kita beri nama r_0.05. Selanjutnya pada kotak isian Numeric Expression  isikan rumus berikut:  t_0.05/SQRT(df+t_0.05**2)

Setelah itu klik OK, maka akan muncul hasil sebagai berikut:

Nah, sudah kita dapatkan nilai r tabel disamping nilai t tabel.

Tapi, bagaimana kalau kita persingkat tahapannya dengan cara menggabungkan kedua rumus tersebut sehingga lebih praktis.

Mari kita ulangi tahapan ini dari awal, dengan penjelasan yang lebih ringkas

  1. Buat variabel baru dengan nama variabel misalnya df. Isikan angka df misalnya dari 1-5
  2. Klik Transform >  Compute Variable. Selanjutnya pada kotak isian Target Variable tuliskan nama variabel untuk nilai r tabel. Misalnya kita beri nama r_0.05, dan pada kotak isian Numeric Expression  isikan rumus berikut:  IDF.T(0.95,df)/SQRT(df+( IDF.T(0.95,df))**2)

Hasilnya sama kan ? Tapi yang perlu diingat adalah, nilai r tabel ini adalah nilai satu arah (catatan: berbeda dengan Metode Excel yang hasilnya adalah untuk dua arah). Kalau anda melakukan pengujian dua arah dengan α yang sama seperti diatas yaitu 5 %, maka Anda merubah alpha tersebut menjadi 2,5%  (5% / 2).

Cara Lebih Praktis Menghitung Nilai r Tabel (Metode Excel)

Beberapa sumber menyebutkan bahwa untuk menghitung nilai r tabel kita harus terlebih dahulu menghitung nilai t tabel . Hal ini karena nilai r tabel dihasilkan dari rumus sebagai berikut:

Dimana: r = nilai r tabel, t = nilai t tabel dan df = derajat bebas

Berdasarkan rumus tersebut, maka  pada Excel dilakukan tahapan sebagai berikut: (lihat gambar dibawah)

Pada kolom A dituliskan derajat bebas (df). Derajat bebas dihitung dengan rumus N-2, dimana N adalah jumlah data. Dalam contoh diatas, kita buat df nya 1 – 5

Kolom B kita gunakan untuk menghitung nilai t tabelnya.  Pada  sel B2 kita tuliskan angka 0,05. Contoh ini adalah untuk mencari nilai t tabel dengan α ( tingkat signifikansi 5%). Kemudian pada sel B3 kita tuliskan rumus berikut:  =TINV(B$2,$A3). Ini adalah rumus untuk mencari nilai t tabel. Selanjutnya, copy rumus tersebut sampai ke sel B7

Kolom C kita gunakan untuk menghitung nilai r tabelnya.  Pada  sel C2 kita tuliskan angka 0,05. Contoh ini adalah untuk mencari nilai r tabel dengan α ( tingkat signifikansi 5%). Kemudian pada sel C3 kita tuliskan rumus berikut:  = =B3/SQRT($A3+B3^2).  Ini adalah rumus untuk mencari nilai r tabel. Selanjutnya, copy rumus tersebut sampai ke sel C7.

Nah, sudah kita dapatkan nilai r tabel.

Tapi, bagaimana kalau kita persingkat tahapannya dengan cara menggabungkan kedua rumus tersebut sehingga lebih praktis. Mari lihat gambar dibawah ini

Sama dengan cara diatas, tapi pada kolom B langsung kita hitung nilai r tabelnya. Bagaimana caranya ? Pada sel B3 tuliskan rumus berikut:  =TINV(B$2,$A3)/SQRT($A3+(TINV(B$2,$A3))^2).

Hasilnya sama kan ?. Tapi yang perlu diingat adalah, nilai r tabel ini adalah nilai dua arah. Kalau anda melakukan pengujian satu arah dengan α yang sama seperti diatas yaitu 5 %, maka Anda merubah alpha tersebut menjadi 10% (2 x 5 %).

Cara Membaca Tabel F

Tulisan kali ini akan membahas mengenai cara membaca tabel F. Sederhana memang. Tetapi hal-hal yang sederhana seringkali juga  membutuhkan pemahaman tersendiri, karena ternyata dari beberapa pertanyaan yang masuk ke blog ini menunjukkan adanya kebingungan dalam membaca tabel  F.

Salah satu bentuk struktur tabel F yang tersedia pada buku-buku statistik/ekonometrik  adalah sebagai berikut: (tabel F lengkap dalam bentuk format ini dapat didownload disini)

Judul tabel biasanya memuat keterangan mengenai nilai probabilita dari tabel F yang disajikan. Dalam contoh diatas, probabilitanya adalah 0,05.

Lalu apa itu yang dimaksud dengan probabilita pada tabel F tersebut ?

Dalam pengujian hipotesis, kita terlebih dahulu menetapkan tingkat/taraf signifikansi pengujian kita (biasanya disimbolkan dengan α (alpha)). Misalnya 1 %, 5 %, 10 % dan seterusnya. Nah, taraf/tingkat signifikansi tersebut yang merupakan probabilita dalam tabel ini.

Judul  masing-masing kolom mulai dari kolom kedua (angka yang dicetak tebal) dari tabel tersebut adalah derajat bebas/degree of freedom (df) untuk pembilang, atau dikenal dengan df1. Juga sering disimbolkan dalam tabel F dengan simbol N1 seperti tabel diatas.

Selanjutnya, judul masing-masing baris adalah derajat bebas/degree of freedom (df) untuk penyebut, atau dikenal dengan df2. Juga sering disimbolkan dalam tabel F dengan simbol N2 seperti tabel diatas.

Bagaimana menentukan  df1 (N1) dan df2 (N2) tersebut ?

Rumusnya:

df1 = k -1

df2 = n – k

dimana k adalah jumlah variabel (bebas + terikat) dan n adalah jumlah observasi/sampel pembentuk regresi.

Misalnya kita punya persamaan regresi dengan dua variabel bebas dan satu variabel terikat. Jumlah sampel pembentuk regresi tersebut sebanyak 10. Maka  df1= k-1 = 3 – 1 = 2 sedangkan df2 = n – k = 10 – 3 = 7

Jika pengujian dilakukan pada α = 5%, maka nilai F tabelnya adalah 4,74. Lihat pada N1=2 dan N2= 7 pada tabel diatas.

Sebagai catatan, juga terdapat format tampilan tabel F seperti gambar dibawah ini. Pada prinsipnya sama, yang membedakan adalah, probabilitanya di letakkan dalam satu kolom setelah N2.  Dengan demikian jika kita ingin mencari nilai F tabel misalnya  dengan df1=2, df2 = 2 dan α = 5%, maka lihat pada N1= 2, N2 =2 pada baris 0.05

Ok. Cukup sekian dulu.

Membuat Tabel F dengan SPSS

Pada tulisan sebelumnya, kita telah membahas cara membuat tabel t dengan SPSS. Lihat tulisan ini. Kali ini, kita akan membahas cara membuat tabel F dengan SPSS

Berikut tahapannya:

1. Buka program SPSS, kemudian buat variabel baru untuk pengisian derajat bebas. Variabel derajat bebas yang kita buat adalah untuk derajat bebas 2 (df2) atau penyebut. Misalnya kita beri nama variabel tersebut df_2. Bagi yang belum memahami cara menginput data di SPSS, klik disini

2. Kemudian isikan nilai derajat bebas 2 (df2) pada variabel tersebut. Terserah Sdr. mulai dari 1 sampai berapapun. Lihat contoh pada gambar berikut, misalnya dari df 1 – 8

3. Setelah itu klik Transform >  Compute Variable.  Akan muncul tampilan berikut:

Pada kotak isian Target Variable, isikan nama variabel untuk nilai F tabel yang akan kita hitung. Misalnya dalam contoh diatas kita beri nama df1_1_0.05 (karena kita ingin menghitung F tabel dengan df1 (pembilang)=1 berapapun df2 nya, dan dengan α = 5 %)

Pada kotak isian Numeric Expression: isikan rumus berikut:  IDF.F(0.95,1,df_2)

(Catatan: sebenarnya rumus tersebut bisa dibuat dengan menu dropdown, tapi tidak kita bahas disini).

Pada rumus diatas, angka pertama dalam kurung (sebelum tanda koma) yaitu 0.95 adalah tingkat/taraf keyakinan (level of confidence).  Taraf keyakinan ini  = 1 – α.  Nilai  α  (alpha) ini sendiri adalah tingkat/taraf signifikansi (level of significance). Jadi dalam contoh, misalnya kita ingin mencari nilai t tabel pada taraf signifikansi = 5 % (0.05), maka diisi pada rumus tersebut 1 – 0.05 = 0.95. (catatan: perhatikan perbedaannya dengan Excel. Pada rumus Excel, angka yang kita masukkan adalah langsung nilai α nya).

Selanjutnya, pada rumus diatas, angka yang diapit tanda koma yaitu angka 1 adalah nilai df1 nya. Dan yang dibelakang tanda koma adalah nama variabel tempat penyimpanan nilai df2  yang telah kita tuliskan sebelumnya. Karena nama variabel yang kita buat sebelumnya adalah df_2, maka tulis df_2 pada rumus tersebut.

3. Setelah itu klik OK, maka akan muncul hasil sebagai berikut:

Kolom disamping df_2 adalah nilai F tabel untuk  df1=1 dan alpha = 0.05. Dengan cara yang sama, kita menghitung F tabel untuk nilai df1 lainnya (misalnya df1=2, df1=3  dstnya). Dengan cara yang sama kita juga mengganti α nya.

Ok, cukup  sekian dulu. Anda juga bisa melihat cara membuat F tabel dengan Excel. Lihat tulisan ini.   Anda juga bisa mendownload tabel F lengkap, klik disini