Statistical Power


Did you know Santa once took a statistics class? He had trouble remembering which hypothesis should have the equal sign so he would keep repeating: the null hypothesis, the null hypothesis, the null hypothesis. In fact, to this day you can hear him say Ho, Ho, Ho! (Mark Eakin)
Apakah statistical power? Statistical power, atau kadang  dikenal dengan power dari suatu pengujian pada tingkat signifikansi α didefinisikan sebagai suatu probabilitas akan menerima hipotesis null ketika hipotesis tersebut benar. Secara ringkas, dapat dirangkum dalam tabel berikut. power-table Maksudnya? Ada baiknya kita bahas satu persatu istilah – istilah di atas. Apa itu hipotesis? Suatu pernyataan yang akan diuji ‘kebenarannya’. Yang dimaksud kebenaran di sini adalah relative, yaitu seberapa kuat pernyataan tersebut didukung oleh data. Hipotesis terbagi dua, yaitu:
  • Hipotesis awal (hipotesis null), biasa disimbolkan Ho.
  • Biasanya mengambil satu nilai tertentu, spesifik.
Hipotesis alternative, merupakan komplemen dari hipotesis awal, biasa disimbolkan H1 atau Ha
  • Dapat berupa satu nilai yang spesifik, ataupun berupa interval.
  • Biasanya ‘kecurigaan’ kita dinyatakan di sini
Contoh: Pemerintah menyatakan  bahwa harga daging sapi per-kg di pasaran adalah Rp 100.000,-. Namun, kenyataannya masyarakat mengeluhkan mahalnya harga daging sapi, bahkan jauh di atas Rp.100.000,-. Untuk meng-klarifikasi hal tersebut, apakah pernyataan pemerintah masih dapat dipercaya atau tidak, maka kita bisa lakukan pengujian, tentunya setelah mengumpulkan data harga daging sapi di pasaran. Hipotesis yang akan diuji adalah: Ho: Rata – rata harga daging sapi per-kg = Rp 100.000,- Ha: Rata – rata harga daging sapi per-kg di atas  Rp 100.000,- Sebagai dasar pengambilan keputusan, kita tetapkan taraf signifikansi , biasanya α = 0.05 atau 5%.   Apa itu tingkat signifikansi ? Nilai yang menyatakan batas toleransi (antara 0 dan 1) yang kita tetapkan untuk melakukan membuat kesalahan dalam pengambilan kesimpulan. Tentunya kita ingin sekecil mungkin kan peluang untuk berbuat salah? Maksudnya? adalah probabilitas bahwa menolak Ho pada saat Ho benar. Dikatakan ‘benar’, karena kecil sekali kemungkinannya bahwa nilai yang  tertera pada diperoleh secara kebetulan, yang berarti itu haruslah representasi dari kondisi yang sesungguhnya. Kata “kecil sekali” di atas, biasa dikenal dengan istilah p-value, sehingga dalam pengujian hipotesis simpelnya adalah: jika p-value <α maka tolak Ho. Kenapa? Karena kemungkinan kita melakukan kesalahan  lebih kecil dari batas toleransi kesalahan yang kita perbolehkan, α. Lalu apa itu statistical power? Apakah α saja tidak cukup? Dalam praktiknya, jika Ho ditolak, biasanya kita tidak perlu menghitung power.  Akan tetapi, jika Ho tidak ditolak, maka dirasa perlu menghitung power. Kenapa? Alasan praktis: Biasanya kita melakukan pengujian untuk mengonfirmasi kecurigaan kita akan suatu fenomena. Kecurigaan itu kita letakkan pada H1. Kecurigaan kita itu mestinya karena merasa sesungguhnya apa yang terjadi tidak seperti yang dinyatakan (pada Ho), seperti kasus harga daging di atas. Jadi, mestinya kecurigaan kita didukung oleh data dong? Yang artinya H1 diterima, Ho ditolak. Tapi kok, Ho tidak ditolak? Karena itu, kita ingin meyakinkan, bahwa tidak ada yang salah dengan pengujian ini. Bagaimana mengetahui bahwa hasil pengujian ini memang bisa dipercaya? Ya dengan power tersebut. Kok bisa? Simpel saja. Kita lebih bisa bersandar  pada sesuatu yang lebih kuat bukan, dibandingkan dengan yang lemah bukan? Kekuatan itu diukur dari power. Suatu  pengujian dikatakan bagus, hasilnya memang bisa dipercaya, jika powernya besar. Ingat kembali arti power:

probabilitas menerima Ho pada saat Ho benar.

yang berarti suatu tindakan yang benar, bukan? Jika memang salah, harus ditolak, dengan tingkat keyakinan yang tinggi. Jika menolaknya ragu – ragu (power kecil), maka sama saja tidak yakin apakah memang benar Ho tersebut salah. Karena itu, saat Ho tidak ditolak → apa memang penerimaan ini karena Ho benar?   Masih ingat logika implikasi?

Jika  p maka q setara dengan jika ~q maka ~p .

Jika hujan maka saya pakai payung

setara dengan

jika saya tidak pake payung maka pasti saat itu tidak hujan (karena kalau hujan saya pasti akan pakai payung).

Menggunakan logika tersebut, maka:

Jika Ho salah , maka tolak Ho,

setara dengan

jika Ho tidak ditolak, maka mesti karena Ho tidak salah.

Dan tingkat kebenaran pernyataan ini pada uji kita diukur oleh power. Dan pengujian yang bisa dipercaya semestinya memberikan power yang besar. Seberapa besar power yang bagus? Makin dekat dengan 1 makin bagus, artinya tingkat keyakinan kita terhadap kebenaran hasil uji tersebut mendekati 100%. Namun, umumnya 0.8 sudah dianggap cukup baik. Bagaimana mendapatkan power yang besar? Nilai power ditentukan oleh:
  1. Variabilitas data (diukur dari variansi): makin besar variansi data, makin kecil power.Logis saja kan? Makin susah mengambil kesimpulan dari sesuatu yang kondisinya sering berubah – ubah.Biasanya kondisi ini sudah inheren di populasi, susah diatasi. Akan tetapi bisa sedikit diperbaiki dengan merancang cara pengumpulan data dengan cermat.
  2. Ukuran sampel: makin besar ukuran sampel, power makin besar.

Logis juga kan? Makin besar sampel, makin banyak informasi yang diperoleh, makin meyakinkan hasil pengujian. Di bagian ini biasanya peneliti bisa berperan lebih banyak, tingkatkan jumlah sampel untuk meningkatkan power pengujian. Akan tetapi, tetap ada kendala yang muncul, misalnya terbentur masalah keterbatasan biaya, waktu, dan tenaga atau sumber daya lainnya.

Apakah kita bisa mengetahui berapa power pengujian sebelum bahkan mengumpulkan data? Bisa, dengan syarat kita tahu informasi mengenai kondisi populasi (variansi), bisa dari pengalaman atau literature, dan ukuran sampel yang akan diambil. Atau dengan pilot study terlebih dahulu. Pada perangkat lunak R, bisa dilakukan dengan menggunakan package “pwr”. Untuk uji t, ikuti syntax berikut. power1 power2   power3   Contoh: Data hipotesis denyut jantung, diukur dengan variable hr (heart rate), akan diuji apakah rerata denyut jantung 150 atau bukan. power4 Diperoleh hasil power5   Ho tidak ditolak. Maka ingin diketahui power pengujian. Karena df = 269, maka kita tahu bahwa n = 269 + 1 = 270.   power6 dimana mean (hr) dan standar deviasi, sd(hr) dihitung langsung dari data. Seandainya kita belum punya data sama sekali, namun kita ingin mengetahui power jika akan menggunakan sampel berukuran 270, dengan rerata pengamatan kita nanti tidak jauh berbeda nilai dugaan kita (delta = 0.3), perkiraan standar deviasi 1.5, dan tingkat signifikansi 5%, maka dengan prosedur berikut:   power7 diperoleh power = 0.906. Cukup besar. Akan tetapi, katakan kita ingin power yang lebih besar, misal 99%. Berapakah ukuran sampel yang diperlukan? power8   Ternyata diperlukan paling tidak 462 pengamatan untuk power sebesar itu. Wajar saja, bukan? No pain, no gain. Ingin hasil meyakinkan, bekerjalah lebih keras, kumpulkan data lebih banyak.   Jika ada pertanyaan lebih lanjut, atau saran maupun komentar, silakan tinggalkan pesan ya :) stats-power-feature     

Tidak ada komentar:

Posting Komentar

Relevant & Respectful Comments Only.