Transformasi Data dengan SPSS


Seorang pengunjung blog ini (Marol) menanyakan bagaimana cara mentransformasi variabel dengan menggunakan SPSS. Beliau sudah mencoba beberapa kali, ternyata selalu gagal.

Jawabannya diberikan dalam postingan ini, mudah-mudahan juga bisa membantu yang lainnya.

Sebagai contoh, misalkan kita ingin mentransformasikan variabel Penjualan berikut ini dengan melogaritma naturalkan.

600  400  350  625  1000  710  825  700  820  725  1800

Tentunya data tersebut harus diketik dalam satu kolom pada worksheet SPSS (karena ini adalah satu variabel). Kemudian beri nama variabel tersebut dengan nama Penjualan.

Selanjutnya, untuk mentransformasi variabel ini,  Klik Transform > Compute Variable. Akan muncul tampilan berikut:

transformasi

Pada kotak Target Variable, masukkan nama variabel untuk menampung data hasil transformasi variabel tersebut. Misalnya dalam contoh kita diatas, diberi nama LnJual. Dengan cara ini, akan menghasilkan satu variabel baru dengan nama LnJual. Tetapi jika nama yang diberikan sama dengan nama variabel asal (misalnya jika diisi dengan nama Penjualan), maka hasil transformasi akan menindih variabel asal (data variabel asal akan diganti dengan data hasil transformasi).

Pada kotak Numeric Expression, isikan perintah transformasinya.  Anda bisa mengisi perintah transformasi ini dengan dua cara:

a. Membuat rumus sendiri, misalnya: 2*Penjualan atau Penjualan**3. (Catatan: perkalian menggunakan bintang satu, pangkat menggunakan bintang 2)

b. Menggunakan fungsi yang sudah disediakan SPSS dalam kotak Function Group.

Dalam contoh ini kita akan melogaritmakan variabel. Fungsi tersebut sudah disediakan oleh SPSS dalam Kelompok Fungsi  Arithmethic.

Oleh karenanya, klik Arithmethic, maka akan muncul di kotak Function and Special Variables, fungsi-fungsi yang tersedia pada kelompok arithmetic ini (lihat gambar diatas).

Kemudian klik Ln, dan klik tanda panah  yang mengarah ke atas pada gambar diatas.  Maka pada kotak Numeric Expression akan muncul  tulisan seperti ini: LN(?).

Selanjutnya klik variabel Penjualan (variabel asal yang akan ditransformasikan), dan klik panah yang mengarah kekanan dari gambar diatas. Prosedur ini akan mengganti tanda tanya diatas menjadi Penjualan, sehingga tulisan pada kotak Numeric Expression akan menjadi: LN(Penjualan).

Proses mengisi kotak Numeric Expression ini cukup berbelit, tetapi jika Anda sudah hafal  cara penulisan fungsinya, anda tidak harus melalui tahapan-tahapan tersebut. Cukup langsung diketikkan saja: LN(Penjualan).

Setelah itu klik OK, maka  akan akan keluar output dari logaritma natural dari penjualan yang berada pada variabel baru yang bernama LnJual.

Cara mentransformasikan dengan fungsi-fungsi lainnya adalah relatif sama dengan cara melogaritmakan diatas. Lalu kenapa Sdr. Marol selalu gagal mencobanya ?Ada beberapa kemungkinan:

1. Nama variabel yang dimasukkan ke dalam kotak Numeric Expression tidak sama dengan nama variabel yang sudah ada (yang akan ditransformasikan).

2. Variabel tersebut bukan variabel numerik (untuk variabel bukan numerik atau variabel string). Untuk variabel string, ada fungsi khususnya pada kotak Function Group di atas.

3. Atau penyebab lainnya, tetapi sifatnya kasuistis yang tidak bisa dideteksi dari sini, tanpa melihat langsung file datanya.

Ok, silakan dicoba.

56 Tanggapan

  1. Bagaimana tahapan transformasi data categorik menjadi numerik. Tks

  2. slmt siang pak
    saya ingin bertanya, bagaimana mentransformasi bilangan negatif karn dalam data saya ada bilanagna negatif. Sebelumnya data saya tidak normal pak. trimakasih

  3. pak jun mau tanya:
    data saya time series, salah satu variabel independent saya adalah GDP growth. data GDP growth saya tersebut tidak stasioner sehingga perlu di stasionerkan. saya menggunakan eviews 6.0. yang ingin saya tanyakan bagaimana melakukan stasioner (log) untuk data yang negatif, karena banyak data GDP growth saya yang negatif. trimakasih pak. mohon balasannya untuk kepentingan tesis saya.

  4. Selamat sore pak. Saya mau bertanya tentang masalah skripsi saya.
    Jumlah sampel :30 perusahaan. 2 tahun penelitian (th 2010-2011).
    Masalahnya dividen yang saya olah datanya tidak normal karena nilainya berbeda jauh satu sama lainnya.
    1. Apakah bisa Ln di lakukan pada beberapa bagian dalam 1 variabel saja?
    misalnya
    Thn 2010 Dividen
    Perusahaan A = 0,02
    Perusahaan B = 0,04
    Perusahaan C = 12,30
    Perusahaan D = 24,34
    Apakah boleh yang di LN hanya perusahaan C dan perusahaan D saja??

    2. Apakah variabel yang sudah di LN boleh di LN lagi??

  5. Ass. pak kita butuh bantuan nih, sering kali responden tidak jujur dalam menjawab pertanyaan pewawancara, krn mereka khawatir penelitian ini kan berhubungan dan berkelanjutan dengan pajak. usah apa yang harus kita lakukan

  6. pak numpang nanya, Bagaimana langkah2 mengentry data ke SPSS dengan Analisis 2 SLS hingga sampai keluar out put/hasilnya?

  7. apa alasannya kita menggunakan ln? dan dari buku ap referensi tersebut?

  8. pak ..
    nech cma 2 variabel ..
    tpi variabel Y nya dalam angka triliun dan variabel X nya dalam angka juta ..
    berdasarkan teori ada hubungan signifikan .. tpi begitu datanya diregres hasilnya negatif pak .,,
    apa ada solusi pak ??
    apa datanya mesti di Ln kan ??
    trims

  9. Cara mengakali data mentah agar ditransformasi menjadi normal. karena hasil transformasi tidak normal

  10. Pak saya mau tanya..
    Kn saya menguji variabel dependen harga saham angkanya ribuan.. Dan variabel independennya laba akuntansi, arus kas, kmponen arus kas ( ako, aki dan akp) angkanya miliaran dan negatif pak..
    Jadi gmn cara saya menormalkannya pak? Dengan tranformasi ap pak..
    Mohon bantuannya y pak..
    Makasih..

    • Dear Raudhatul Jannah, saya minta tolong banget dong,, untuk diemailin skripsi kamu yang judulnya variabel dependen harga saham Dan variabel independennya laba akuntansi, arus kas, kmponen arus kas ( ako, aki dan akp), soalnya saya bingung mengenai logaritma natural jika angkanya negatif, Please. saya ingin mempelajari skripsi anda karna judulnya agak mirip dengan punya saya. tolong di emailin ke ” lesmana_soni@yahoo.com “, please.

  11. pak, saya mau nanya…
    apa persamaan regresi yang baru setelah di transformasi data?
    mohon bantuannya pak…
    terimakasi sebelumnya pak

  12. pak saya maw tanya,,,
    saya mau mentransformasi variabel saya yg distribusi ny tdk normal, mengunakan fungsi SQRT,, setelah saya tranformasi, ternyata hasil masih tdk normal pak,.
    yg maw saya tanyakan,, bisa kah saya melakukan transformasi sebanyak 2 kali untuk variabel yg sama, krn setelah saya tranformasi kan 2 kali bru variabel berdistribusi normal,,
    mohon pencerahan ny pak,,,
    terimakasih..

    • Pak, jika data sudah di Ln kan, tetapi masih aja belum terdistribusi normal, apa yang harus kita lakukan

    • Siang Pak
      Saya mau merubah data mentah saya dari tidak normal menjadi normal, karena saya telah melakukan transformasi masih juga tidak normal, mohon petunjuk cara menngakali data mentah biar menjadi normal setelah ditransformasi

  13. permisi Pak, saya mahasiswi akuntansi yang lagi nyusun skripsi dengan variabel dummy timeliness dan diclosure.
    variabel saya ada leverage dan size jg. berdasarkan uji normalitas tidak normal distribusinya. tapi stelah di transformasi ke Ln juga tetap tidak terdistribusi normal. mohon Bapak dpt membantu… terima kasih.. 🙂

  14. numpang tanya ya mas jika data kita tidak normal lantas di ubah ke logaritma normal, trus apabila ada data yang negatif kan jadi hilang. terus mempengaruhi jumlah N (sampel) yang juga berkurang. apakah itu suatu yang wajar atau ada solusi yang lain?

  15. Pak, saya mau tanya nih, gimana mentransformasi / merubah data dari ordinal ke interval dengan menggunakan SPSS
    mohon bantuannya ya pak? trims

    Secara prinsip menurut saya bisa. Hanya perlu menyusun rumus-rumusnya. Saya sendiri belum mencoba menyusun rumus-rumus tersebut.

  16. Assalamualaikum wr.wb
    mohon penjelasannya mengenai grafik histogram moderate positive skewness yang bentuk transformasinya SQRT (k-x).bagaimana cara transformasi datanya.terimakasih

    k dan x itu simbol apa?

    • k (konstanta yang berasal dari setiap skor dikurangkan sehingga skor terkecil adalah 1) sedangkan x akar kuadrat.mohon bantuannya pak.terimakasih

    • Asslmlkm,,,
      pak,,,saya mau tanya,,ada ga kekurangan dari transformasi data?shgga data yg ada akan dirujuk menggunakan konsep General linear model…
      trmksh,,

  17. Assalamu’alaikum wr.wb
    pak, saya mo tanya. Saya sudah mencoba untuk meng LN kan data saya, tapi tetap saja hasilnya tidak normal. Saya menggunakan 29 sampel yang terdaftar di JII dengan periode tahun, hanya 1 tahun. Untuk uji multikolinearitas, sudah terbebas hanya saja, data saya tidak ada yang signifikan. Saya menggunakan 1 variabel Y dan 3 Variabel X pak. Mohon bantuannya ya pak. Terima kasih!
    Wassalam.

  18. met siang pak.. mohon attensinya gimana ya kalo rumusan histogram dgn transformasi substansial negative skewness (lg10p(k-x).., ketika dioutput bernilai missing value sementara k itu khan nilai max…trims

  19. mf pak,saya mau tanya jika pada anreg ganda jika asumsi non autokorelasi dan heteroskedastisitas tidak terpenuhi (asumsi klasik) kan data bisa ditransformasi..apa boleh mentransformasi hanya pada var y atau salah var x saja?
    terimakasih pak.

  20. pak… mohon bantuannya, kebetulan sy sedang melakukan analisa peramalan menggunakn metode eksponential smoothing dengan spss 13. sy bingung untuk memasukkan option2 yg ada dalam spss, mohon bantunnya untuk menyelesaikan dgn metode single, double dan triple eksponential smoothing

  21. kalo perintahnya SQRT(k-X1) k itu apa? jumlah seluruh variabel atau kolom dlm SPSS?

  22. Assalamualaikum,,Salam kenal pak,,,
    Pak mau nanya, sy sedang mengolah data, dan data saya g normal. Nilai variabel campur pak, ada yang positif dan yang min (negatif). Saya menggunakan 4 variabel independen dan 1 variabel dependen. Yang saya mw tanyakan.
    1. Sy mencoba menggunakan LN tapi data yang bernilai min hilang semua (missing), kalau data ada yang bernilai min, lebih baik menggunakan transformasi jenis apa pak?
    2. Oiy pak data yang missing bagaimana, apa harus diabaikan (tidak digunakan)?
    3. Saat menggunakan LN dari keempat variabel independen ada 1 variabel yang belum normal, nilai residualnya masih di bawah 0,05 (uji menggunakan K-S), apa yang harus dilakukan pak?
    terimaksih ats perhatiannya,,mohon balasannya pak

  23. trimakasih pak tulisannya
    sangat bermanfaat untuk tugas saya.

  24. Bapak saya ingin bertanya, setelah selesai melakukan transformasi dan diperoleh bahwa data normal, maka data yang digunakan untuk uji parametrik data yang mana pak? data hasil transform itu juga??
    Terimaksih 🙂

  25. siang pak, kalau analisis median polish pake spss gmn caranya pak…?

  26. mau tanya ne, kalau analisis median polish menggunakan spss gmn caranya…?

  27. assalamualaikum pak…
    saya mau tanya,
    arti dari median polish apa ya?
    lalu bagaimana jika di aplikasikan dalam spss?
    terima kasih

  28. malam pak..

    saya ingin bertanya,
    saya sudah melakukan uji normalitas.. tetapi hasil datanya tidak normal,
    sehingga tdk bisa d lanjutkan homogenitas, uji pos hoc dan anova
    saya pakai uji anova one way pak
    masih bingung pak…
    itu cara mentransformasinya apakah sama dengan yang d atas ya pak?

    trmksh

  29. saya mau tanya mengenai transformasi pada uji park…
    pada uji park smua variabel independen setelah diregresi dan didapat residualnya kan ditransform jd Ln utk mngetahui heterokedastisitasnya…
    yang ingin saya tanyakan, apabila pada model regresi sudah dilakukan transformasi, misal x1 menjadi LnX1, lalu apakah utk uji park LnX1 harus di Ln-kan lagi menjadi Ln(LnX1) atau biyar tetap LnX1…?
    terimakasih

  30. variabel saya ada 10, yg tidak normal 3, apakah saya harus transformasi semua variabel ataukah 3 variabel yg tidak normal saja?, mohon pencerahannya…

    Maksud transformasi untuk menormalkan variabel ? Ya cukup variabel yang tidak berdistribusi normal saja. Tapi itu juga tergantung dari model yang akan dibangun. Bisa saja model menghendaki bahwa semuanya juga harus ditransformasi

  31. pak saya mw tny
    sy pny variabel dependent return saham
    independent arus kas operasi, arus kas investasi, arus kas pendanaan, laba kotor dan size perusahaan
    var dependent bentuknya desimal, sedangkan independent milyaran, selain itu ada angka negatif juga..
    yg sy mw tny gmn caranya??
    apa benar perlu di log natural dulu??tp angka negatif kan tidak bisa di log natural??
    terima kasih sebelumnya

    Ada tulisan menarik yang membahas mengenai alternatif transformasi nilai negatif ini disalah satu situs. Silakan kunjungi ini

  32. assalamu’alaikum pak,,,
    saya mw tanya, transformasi data yang cocok untuk data yang ada data negatifnya itu apa pak?
    mohon bantuannya,,,terima kasih

  33. pagi pak, mau tanya ya..
    data saya kebetulan ga normal,
    trus saya nyari informasi katanya ditransformasi gt.
    kebanyakan referensi bilang di-log-kan.
    trus saya ada baca katanya log kurang cocok untuk data yang negatif, padahal data saya ada yang negatif.
    gimana ngatasin data tidak normal saya pak?
    sebenarnya ada kriteria tertentu ga sih pak untuk menentukan transformasi apa yang diperlukan/yang tepat untuk jenis data tertentu?
    kalo ada, tolong dikasih detailnya ya pak…

    mohon bantuannya
    terimakasih

  34. sore pak.. saya mau nanya soal pengolahan data, yg saya bingung saya gak tau rumus apa yg mau dipakai dalam skripsi saya ini..

    skripsi saya adalah tentang eksperimen : Pengaruh sistem penggajian terhadap motivasi kerja karyawan.

    saya disuruh membandingkan antara sebelum dan sesudah penggajian, yg saya tanyakan. penelitian menggunakan angket dan variabelnya adalah motivasi kerja, hny 1 variabel.
    dosen saya menyuruh untuk menguji dengan Ttes dan lakukan uji normalitas dan homogenitas.

    saya mohon bantuannya pak, Terimakasih banyak pak

    Ya, itu sudah tepat. Kalau datanya kurang dari 30, gunakan t test, kalau lebih gunakan z test. Rumus-rumusnya bisa dilihat di buku statistik non-parametrik.

  35. Dear Jun…

    data yang saya oleh tidak normal akhirnya saya log kan…
    mohon bantuannya pak?
    1. varibale saya ada 4 untuk independen, 1 untuk dependen. Yang tidak normal adalah 3 independen, apakah ke empat variable harus di log kan atau hanya 3 yang tidak normal saja pak?

    2 Setelah di log kan datanya ada yang kosong pak, apakah yang dipakai hanya yang isi aja?

    3. Setelah saya uji linear data yang sudah log kenapa hasilnya error pak?

    Terima kasih atas bantuannya pak

    • yang diuji normal hanya dat avariabel dependennya saja, jadi kalau data dependennya sudah normal, tidak usah di transformasi lagi. kalaupun memerlukan transformasi dalam paket program Minitab disediakan metode Box – Cox. dengan metode tersebut didapat nilai lambda dan kemudian data (sebut X) ditransaformasi menjadi X pangkat lambda. secara general metode tersebut menghasilkan data yang normal.

  36. Siang pak..saya mw tanya,
    jika data yang telah kita Ln kan berdistribusi normal, kemudian untuk melakukan uji selanjutnya (dalam hal ini saya menggunakan uji paired t sample pak), data mana yang kita gunakan untuk uji paired tersebut, data sebelum di Ln atau setelah di Ln?
    Mohon penjelasnya ya pak.. Thanks

    Tentunya yang diuji adalah data yang telah di Ln-kan. Karena yang berdistribusi normal kan data Ln- nya

  37. Pak… saya sedang kebingungan mentransformasi data.. saya sedang meneliti pengaruh variabel misal usia terhadap total score individu (kuesioner)… setelah saya uji normalitas tidak normal,,,, saya bingung memilih function yang cocok… karna saya sudah mencoba seperti sqrt, log,, tapi setelah dianalisa tetap tidaknormal,,, TT ….

  38. mlm pak mw tanya
    kalo mw me-Ln kan harus memasukan variabel yang mana?saya pernah membaca kalo yang di-Ln kan adalah variabel bebas yang nilainya tinggi.nah saya mencoba me-Ln kan variabel y saja tp x nya,terus mencoba sebaliknya malah hasilnya berbeda semua.tolong penjelasannya pak.trims

    Silakan lihat penjelasannya pada dua tulisan saya berikut:
    Bentuk Fungsional Regresi Linear (Seri 4a. Model Ekonometrik dengan SPSS)
    Bentuk Fungsional Regresi Linear (Seri 4b. Model Ekonometrik dengan SPSS)

  39. Assalamu’alaikum, Pak sy mau tny, jika distribusi data tidak normal dan sya me-Ln(Logaritma natural) variabel y,lalu hslnya distribusi menjadi normal. tapi sya bingung alasan me-Ln(Logaritma natural) variabel y, knp data menjadi berdistribusi normal??Tolong penjelasannya Pak. Trims

    Salah satu alasan melogaritmakan variabel adalah untuk membuat distribusi data menjadi normal. Selain alasan tersebut juga tuntutan model. Misalnya model double log (variabel bebas dan terikatnya sama-sama di logkan). Untuk penjelasan lebih jauh lihat beberapa tulisan saya di blog ini

  40. pak saya mau nanya , saya punya data 5 tahun kebelakang, saya mau proyeksi data itu untuk 5 tahun kedepan dengan metode regresi linier dan metode bunga berganda tu bagaimana ya? mohon bantuannya pak?

    email saya raiscivil@gmail.com

  41. cara mengecek hasil spss secara manual gmn maz? misalnya untuk mengetahui t hitung tu dari kolom apa dikalikan/dibagi/ditambh/dikurangi sama angka yang dimana sehingga ada hasil t tabel tersebut

  42. Mas kl bwt tabel harga kritis rs(rank sperman)dengan spss gmana carax ya maz.thkz.

    Kayaknya tidak ada fasilitas untuk buat tabel harga kritis rs dengan spss. Atau mungkin saya yang belum tahu

  43. Pak udah saya coba dan berhasil terimaaaa kasih banyak, ilmu ini akan saya bagi2 kan ke teman saya, sekali lagi terima kasih banyak :-).

    Ya, selamat berbagi.

  44. wah Bapak cepat blas nya, gak ngira Pak, kalo gitu saya coba Pak , mdah2an berhasil, thanks a lots. 😉

    • bgmn cara memasukkan datax??
      Variabel Y : Return Saham
      X1 : Eva
      X2 : ROA
      X3 : Leverage
      tapi untuk lima perusahaan periode per thn 2004-2009.
      1.sy mncri pngaruh Eva trhdp Return saham
      2.ROA thrdp return saham
      3.Leverage terhadap return saham
      4. scr simultan terhadap return saham

      Cara memasukkan datanya: kolomnya adalah variabel. Jadi ada empat kolom yaitu Y, X1, X2, X3. Barisnya adalah data perusahaan pertahunnya. Jadi, karena ada lima perusahaan dan ada lima tahun, berarti barisnya ada 25. Tapi harap hati-hati dalam menganalisisnya. Karena data Sdr. adalah gabungan data timeseries dan cross-section (yang dikenal dengan istilah data panel), maka coba pelajari lebih lanjut mengenai perlakuan ekonometrik untuk data panel ini.

      • mas bisa kasih contohnya ndak
        please butuh banged tutornya

      • Kepada Junaedi Chaniago Yth>
        Sy sungguh memperoleh tambahan ilmu dan manfaat dari tulisan bpk Transformasi data dgn spss. Terus mau nanya lagi ni Pak.
        1. Bagaimana cara penggunaan Tranformasi Log (Y+1), Akar Kuadrat, dan Arcsin beserta contoh datanya.
        2. Bisakah menggunakan 2 transformasi dalam satu persamaan? Mis. Y ditrnsformasikan ke Ln, X1 ke Log (Y+1), X2 ke Akar Kuadrat, dan X3 ke Arcsin. Mhn Penjelasannya Pak. Makassar, Basir Paly, 03-10-2011

Tinggalkan Balasan ke marol Batalkan balasan

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses.