Ukuran-Ukuran Numerik Statistik Deskriptif (Bagian 1a)

Sesuai dengan namanya, secara sederhana statistik deskriptif adalah statistik yang bertujuan untuk mendeskripsikan atau menggambarkan data. Terdapat berbagai cara dalam mendeskripsikan data, yang salah satunya adalah dalam bentuk ukuran-ukuran numerik dari hasil pengolahan terhadap data tersebut.

Tulisan ini merupakan lanjutan dari tulisan mengenai “Memanfaatkan Analisis Statistik Deskriptif di Excel“. Fokus utama pembahasan kita kali ini adalah menjelaskan pengertian dan interpretasi output yang dihasilkan Excel tersebut.

Sebagai latihan, ketikkan kumpulan data berikut: 20 40 60 80 100 130 130 160 180. Tempatkan di kolom A mulai dari sel A1 sampai A9 (lihat tampilan 2).

Selanjutnya, klik option, Data Analysis maka akan tampilan seperti tampilan 1 berikut:

Tampilan 1. Tampilan menu Descriptive Statistics

Selanjutnya, isilah input range nya sesuai dengan penempatan data kita tadi. Kemudian isilah output range di C1 , selanjutnya conteng kotak di depan “summary statistics”, kemudian klik Ok. Akan muncul  tampilan output seperti tampilan 2 berikut:

strong>Tampilan 2. Tampilan Output Descriptive Statistics

Terdapat dua bagian pokok dari statistik deskriptif secara numerik, yaitu pengukuran nilai sentral dan pengukuran penyebaran data. Pengukuran nilai sentral adalah penentuan suatu nilai yang mampu menggambarkan/mewakili sekumpulan data. Pengukuran penyebaran data adalah penggambaran bagaimana data tersebut tersebar atau terdistribusi dari nilai sentralnya, atau perbandingan distribusi data tersebut terhadap distribusi normal.

A. Pengukuran Nilai Sentral
1. Mean (Rata-rata)
Dalam output Excel pada menu descriptive statistics, nilai rata-rata yang ditampilkan adalah rata-rata hitung (arithmetic mean). Rata-rata hitung ini adalah pengukuran nilai sentral yang paling umum digunakan. Dalam keseharian kita biasanya mengenal hanya dengan istilah rata-rata.

Rumus untuk menentukan nilai rata-rata hitung:

Dimana:

n = banyaknya data

Nilai rata-rata hitung yang diperoleh sangat dipengaruhi oleh nilai-nilai ekstrim (outlier) dari kumpulan data.

Dari data yang terlihat pada tampilan 2, banyaknya data (count=n) adalah 9 dan jumlah nilai data (sum)

Misalkan lagi, kita punya sekumpulan data lain berikut: 20 40 60 80 100 130 130 160 630.

Kalau kita perhatikan, kumpulan data ini mirip dengan kumpulan data pada tampilan 2, tetapi terdapat satu data (data terakhir) yang bernilai ekstrim (nilainya berada jauh dari kebanyakan nilai data yang ada). Kalau kita hitung rata-ratanya adalah 150. Dengan kata lain, hanya satu nilai ekstrim saja, nilai rata-rata yang kita peroleh 1,5 kali lebih besar dibandingkan nilai rata-rata sebelumnya.

2. Median
Median merupakan ukuran yang kuat (robust) dari nilai sentral. Hal ini dikarenakan nilai median tidak dipengaruhi oleh nilai ekstrim.

Median adalah nilai yang berada di tengah-tengah dari sekumpulan data, jika data tersebut diurutkan baik dari nilai terkecil ke nilai terbesar maupun dari nilai terbesar ke nilai terkecil. Secara rumus, median terletak pada urutan ke (n+1)/2, dimana n adalah banyaknya data.

Sebagai contoh, dari tampilan 2, banyaknya data kita adalah 9, maka mediannya terletak pada urutan ke (n+1)/2 = (9+1)/2 = 5. Data urutan ke 5 pada kumpulan data kita bernilai 100. Artinya, median data tadi adalah 100. (Catatan: perhatikan, meskipun angka terakhir pada data tampilan 2 kita ganti dengan angka ekstrim (misalnya 630 seperti contoh sebelumnya), median kita nilainya juga 100. Menunjukkan bahwa nilai median tidak dipengaruhi oleh nilai ekstrim).

Dalam kasus lain, misalnya kita punya kumpulan data berikut: 5 7 10 13 20 22. Banyaknya data adalah 6, dengan demikian median terletak pada urutan ke (n+1)/2 = (6+1)/2 = 3,5. Ini berarti median terletak ditengah data urutan ketiga (10) dan keempat (13). Dengan demikian, nilai mediannya adalah (10+13)/2 = 11,5.

3. Mode (Modus)
Modus (Mode) adalah nilai yang paling sering muncul dari sekumpulan data. Sebagaimana halnya dengan median, nilai modus juga tidak dipengaruhi oleh nilai ekstrim.

Modus dapat digunakan baik pada data numerik maupun data kategorik/kualitatif untuk menggambarkan nilai sentral atau nilai rata-rata. Meskipun demikian, modus lebih umum digunakan untuk data kategorik atau kualitatif.

Dalam keseharian, sebenarnya kita sudah sering menggunakan modus ini. Misalnya pernyataan “sekarang lagi mode perempuan berambut pendek”. Ini artinya, banyak ditemukan perempuan berambut pendek. Dalam pengertian lain dapat juga diartikan, rata-rata perempuan berambut pendek.

Pada tampilan 2, output Excel menghasilkan modus dengan nilai 130, karena angka tersebut muncul dua kali dalam distribusi data kita, sedangkan yang lainnya hanya satu kali.

Pada sekumpulan data, bisa saja tidak terdapat mode, atau bahkan terdapat lebih dari satu mode. Pada kumpulan data berikut: 5 7 8 12 14 18 20, maka tidak ada modus pada data tersebut. Pada kumpulan data berikut: 5 7 7 8 12 14 18 18 20, maka terdapat dua modus yaitu 7 dan 18.

(Catatan: pada Excel, ketika tidak ada modus, tampilan yang dihasilkan adalah #N/A. Sebaliknya, jika terdapat lebih dari satu modus, maka yang ditampilkan sebagai modus adalah modus yang berada pada urutan awal)

B. Ukuran Dispersi (Penyebaran) Data
1. Range (Jarak)
Merupakan pengukuran yang paling sederhana untuk dispersi data. Rumus untuk range adalah:

Range = nilai maksimum – nilai minimum

Dalam kasus kita, range nya adalah 160, karena nilai maksimum 180 dan nilai minimum 20.

2. Variance (Varians)
Varians adalah suatu ukuran penyebaran data, yang diukur dalam pangkat dua dari selisih data terhadap rata-ratanya.

Dalam output Excel, rumus yang digunakan adalah rumus untuk data sampel dalam bentuk sample variance. Misalnya dari data kita di awal, dapat dihitung sampel variancenya sebagai berikut:

20

-80

6400

40

-60

3600

60

-40

1600

80

-20

400

100

0

0

130

30

900

130

30

900

160

60

3600

180

80

6400

Jumlah

23800

3. Standar Deviasi
Standar deviasi merupakan akar dari varians (ingat, karena pada varians kita mengkuadratkan selisih data dari rata-ratanya, maka dengan mengakarkannya, kita mendapatkan kembali nilai asalnya).

4. Standard error of Mean
Standard error yang ditampilkan sebagai output Excel (dalam menu descriptive statistics) adalah standard error dari rata-rata (Standard error of Mean). Ini adalah pengukuran untuk mengukur seberapa jauh nilai rata-rata bervariasi dari satu sampel ke sampel lainnya yang diambil dari distribusi yang sama.

Apa perbedaan standard error (of mean) dengan standar deviasi ?.

Kalau standard deviasi adalah suatu indeks yang menggambarkan sebaran data terhadap rata-ratanya, maka standard error (of mean) adalah indeks yang menggambarkan sebaran rata-rata sampel terhadap rata-rata dari rata-rata keseluruhan kemungkinan sampel (rata-rata populasi).

Pengukuran ini berguna, terutama untuk menjawab pertanyaan “seberapa baik rata-rata yang kita dapatkan dari data sampel dapat mengestimasi rata-rata populasi ?”

Rumus standard error of mean dan perhitungan berdasarkan data kita sebagai berikut:

5. Skewness dan Kurtosis
Distribusi normal, atau disebut juga dengan distribusi Gauss, adalah distribusi probabilitas yang paling banyak digunakan dalam berbagai analisis statistika. Distribusi normal memodelkan fenomena kuantitatif pada ilmu alam maupun ilmu sosial, dan kebanyakan estimasi dan pengujian hipotesis statistik mengasumsikan normalitas suatu data.

Oleh karenanya, sebelum menganalisis data lebih jauh, peneliti umumnya terlebih dahulu menyelidiki normalitas datanya. Jika kemudian, data (sampel) menunjukkan distribusi tidak normal, dilakukan penambahan sampel atau transformasi data dengan transformasi matematik seperti logaritma, mengkuadratkan, mengakarkan atau transformasi resiprok (1/x).

Skewness dan kurtosis merupakan dua alat ukur dalam menelusuri distribusi data yang diperbandingkan dengan distribusi normal. Skewness merupakan pengukuran tingkat ketidaksimetrisan (kecondongan) sebaran data di sekitar rata-ratanya. Distribusi normal merupakan distribusi yang simetris dan nilai skewness adalah 0. Skewness yang bernilai positif menunjukkan ujung dari kecondongan menjulur ke arah nilai positif (ekor kurva sebelah kanan lebih panjang). Skewness yang bernilai negatif menunjukkan ujung dari kecondongan menjulur ke arah nilai negatif (ekor kurva sebelah kiri lebih panjang).

Rumus skewness  adalah sebagai berikut:


Dalam kasus data kita, di dapatkan nilai skewness sebesar -0,0178. Secara manual, angka tersebut dapat dihitung sebagai berikut:

20

-3.1553

40

-1.3311

60

-0.3944

80

-0.0493

100

0

130

0.1664

130

0.1664

160

1.3311

180

3.1553

Jumlah

-0.1109

Selanjutnya, kurtosis menggambarkan keruncingan (peakedness) atau kerataan (flatness) suatu distibusi data dibandingkan dengan distribusi normal. Pada distribusi normal, nilai kurtosis sama dengan 0. Nilai kurtosis yang positif menunjukkan distribusi yang relatif runcing, sedangkan nilai kurtosis yang negatif menunjukkan distribusi yang relatif rata.

Rumus kurtosis adalah:

Dalam kasus data kita, di dapatkan nilai kurtosis sebesar -1,1764. Secara manual, angka tersebut dapat dihitung sebagai berikut:

20

4.6279

40

1.4643

60

0.2892

80

0.0181

100

0

130

0.0915

130

0.0915

160

1.4643

180

4.6279

Jumlah

12.6748


6 Tanggapan

  1. Assalamau’alaikum,
    Ma’af Pak Jun, saya mau tanya tentang ukuran kedekatan untuk data ordinal. Bisa minta tolong dijelaskan atau kalau Bapak memiliki referensi tentang materi tersebut, tolong dikirim via email. Ukuran jarak ini saya perlukan untuk pengelompokan pada analisis kelompok data ordinal. Terima kasih.

    Wassalam

    Saya tidak mengerti maksud pertanyaan “ukuran kedekatan untuk data ordinal”. Kalau maksudnya urutan skala pengukuran, bisa dilihat pada tulisan saya mengenai “memahami skala pengukuran”. Saya juga tidak mengerti mengenai maksud ukuran jarak untuk pengelompokan pada analisis kelompok data ordinal. Kalau bisa mohon diperjelas pertanyaannya. (Junaidi)

  2. saya ingin bagaimana cara menafsir dan mengertikan angka-angka pada standar deviasi yang diperoleh data pada penelitian kuantitatif

    Standar deviasi merupakan salah satu ukuran untuk melihat penyebaran data dari rata-ratanya. Selain standar deviasi ada pengukuran lain seperti range dan varians. Semakin besar ukuran deviasi menunjukkan semakin menyebar data tersebut dari rata-ratanya. Untuk penjelasan lebih lanjut, saya sarankan untuk membaca buku-buku statistik pengantar, khususnya statistik deskriptif

  3. mohon beri penjelasan mengenai frontier. trims

    Bisa diperjelas lagi pertanyaannya ?

  4. Pak junaidi, mau tanya ouput pada Excel yg Confidence Level itu dari mana ya mendapatkan nilainya? Trus apa interpretasinya? Mohon jawabannya segera pak. Terima kasih banyak.

  5. saya mahasiswa baru statistika,.. saya sudah observasi ke suatu tempat dengan mengobservasi 4 variabel, saya ingin tahu apa gunanya data dari variabel tersebut??
    terima kasih.

    Data yang diperoleh dari observasi tersebut digunakan untuk menggambarkan keadaan dari variabel yang kita teliti. Untuk menggambarkan keadaan tersebut digunakan berbagai peralatan statistik

    • lalu apa yang dimaksud dengan identifikasi variabel?

Tinggalkan Balasan