Did you know Santa once took a statistics class? He had trouble remembering which hypothesis should have the equal sign so he would keep repeating: the null hypothesis, the null hypothesis, the null hypothesis.
In fact, to this day you can hear him say Ho, Ho, Ho!
(Mark Eakin)
Apakah statistical power?
Statistical power, atau kadang dikenal dengan
power dari suatu pengujian pada tingkat signifikansi α didefinisikan sebagai suatu probabilitas akan
menerima hipotesis null ketika hipotesis tersebut
benar.
Secara ringkas, dapat dirangkum dalam tabel berikut.
Maksudnya?
Ada baiknya kita bahas satu persatu istilah – istilah di atas.
Apa itu hipotesis?
Suatu pernyataan yang akan diuji ‘kebenarannya’. Yang dimaksud kebenaran di sini adalah relative, yaitu seberapa kuat pernyataan tersebut didukung oleh data.
Hipotesis terbagi dua, yaitu:
- Hipotesis awal (hipotesis null), biasa disimbolkan Ho.
- Biasanya mengambil satu nilai tertentu, spesifik.
Hipotesis alternative, merupakan komplemen dari hipotesis awal, biasa disimbolkan H
1 atau H
a
- Dapat berupa satu nilai yang spesifik, ataupun berupa interval.
- Biasanya ‘kecurigaan’ kita dinyatakan di sini
Contoh:
Pemerintah menyatakan bahwa harga daging sapi per-kg di pasaran adalah Rp 100.000,-. Namun, kenyataannya masyarakat mengeluhkan mahalnya harga daging sapi, bahkan jauh di atas Rp.100.000,-. Untuk meng-klarifikasi hal tersebut, apakah pernyataan pemerintah masih dapat dipercaya atau tidak, maka kita bisa lakukan pengujian, tentunya setelah mengumpulkan data harga daging sapi di pasaran.
Hipotesis yang akan diuji adalah:
H
o: Rata – rata harga daging sapi per-kg = Rp 100.000,-
H
a: Rata – rata harga daging sapi per-kg di atas Rp 100.000,-
Sebagai dasar pengambilan keputusan, kita tetapkan taraf signifikansi , biasanya
α = 0.05 atau 5%.
Apa itu tingkat signifikansi ?
Nilai yang menyatakan batas toleransi (antara
0 dan
1) yang kita tetapkan untuk melakukan membuat kesalahan dalam pengambilan kesimpulan. Tentunya kita ingin sekecil mungkin kan peluang untuk berbuat salah?
Maksudnya?
adalah probabilitas bahwa menolak H
o pada saat H
o benar. Dikatakan ‘benar’, karena
kecil sekali kemungkinannya bahwa nilai yang tertera pada diperoleh secara kebetulan, yang berarti itu haruslah representasi dari kondisi yang sesungguhnya.
Kata
“kecil sekali” di atas, biasa dikenal dengan istilah
p-value, sehingga dalam pengujian hipotesis simpelnya adalah: jika
p-value <α maka tolak H
o.
Kenapa? Karena kemungkinan kita melakukan kesalahan lebih kecil dari batas toleransi kesalahan yang kita perbolehkan, α.
Lalu apa itu statistical power?
Apakah α saja tidak cukup?
Dalam praktiknya, jika H
o ditolak, biasanya kita tidak perlu menghitung
power. Akan tetapi, jika H
o tidak ditolak, maka dirasa perlu menghitung
power.
Kenapa?
Alasan praktis:
Biasanya kita melakukan pengujian untuk mengonfirmasi kecurigaan kita akan suatu fenomena. Kecurigaan itu kita letakkan pada H
1. Kecurigaan kita itu mestinya karena merasa sesungguhnya apa yang terjadi tidak seperti yang dinyatakan (pada H
o), seperti kasus harga daging di atas.
Jadi, mestinya kecurigaan kita didukung oleh data dong? Yang artinya H
1 diterima, H
o ditolak.
Tapi kok, H
o tidak ditolak?
Karena itu, kita ingin meyakinkan, bahwa tidak ada yang salah dengan pengujian ini.
Bagaimana mengetahui bahwa hasil pengujian ini memang bisa dipercaya?
Ya dengan power tersebut.
Kok bisa?
Simpel saja. Kita lebih bisa bersandar pada sesuatu yang lebih kuat bukan, dibandingkan dengan yang lemah bukan? Kekuatan itu diukur dari
power. Suatu pengujian dikatakan bagus, hasilnya memang bisa dipercaya, jika
powernya besar.
Ingat kembali arti power:
probabilitas menerima Ho pada saat Ho benar.
yang berarti suatu
tindakan yang
benar, bukan?
Jika memang salah, harus ditolak, dengan tingkat keyakinan yang tinggi.
Jika menolaknya ragu – ragu (
power kecil), maka sama saja tidak yakin apakah memang benar H
o tersebut salah.
Karena itu, saat H
o tidak ditolak → apa memang penerimaan ini karena H
o benar?
Masih ingat logika implikasi?
Jika p maka q setara dengan jika ~q maka ~p .
Jika hujan maka saya pakai payung
setara dengan
jika saya tidak pake payung maka pasti saat itu tidak hujan (karena kalau hujan saya pasti akan pakai payung).
Menggunakan logika tersebut, maka:
Jika Ho salah , maka tolak Ho,
setara dengan
jika Ho tidak ditolak, maka mesti karena Ho tidak salah.
Dan tingkat kebenaran pernyataan ini pada uji kita diukur oleh
power. Dan pengujian yang bisa dipercaya semestinya memberikan
power yang besar.
Seberapa besar power yang bagus?
Makin dekat dengan 1 makin bagus, artinya tingkat keyakinan kita terhadap kebenaran hasil uji tersebut mendekati 100%. Namun, umumnya 0.8 sudah dianggap cukup baik.
Bagaimana mendapatkan power yang besar?
Nilai power ditentukan oleh:
- Variabilitas data (diukur dari variansi): makin besar variansi data, makin kecil power.Logis saja kan? Makin susah mengambil kesimpulan dari sesuatu yang kondisinya sering berubah – ubah.Biasanya kondisi ini sudah inheren di populasi, susah diatasi. Akan tetapi bisa sedikit diperbaiki dengan merancang cara pengumpulan data dengan cermat.
- Ukuran sampel: makin besar ukuran sampel, power makin besar.
Logis juga kan? Makin besar sampel, makin banyak informasi yang diperoleh, makin meyakinkan hasil pengujian. Di bagian ini biasanya peneliti bisa berperan lebih banyak, tingkatkan jumlah sampel untuk meningkatkan power pengujian. Akan tetapi, tetap ada kendala yang muncul, misalnya terbentur masalah keterbatasan biaya, waktu, dan tenaga atau sumber daya lainnya.
Apakah kita bisa mengetahui berapa power pengujian sebelum bahkan mengumpulkan data?
Bisa, dengan syarat kita tahu informasi mengenai kondisi populasi (variansi), bisa dari pengalaman atau literature, dan ukuran sampel yang akan diambil. Atau dengan
pilot study terlebih dahulu.
Pada perangkat lunak
R, bisa dilakukan dengan menggunakan
package “pwr”. Untuk
uji t, ikuti
syntax berikut.
Contoh:
Data hipotesis denyut jantung, diukur dengan variable
hr (
heart rate), akan diuji apakah rerata denyut jantung 150 atau bukan.

Diperoleh hasil

H
o tidak ditolak.
Maka ingin diketahui
power pengujian. Karena
df = 269, maka kita tahu bahwa
n = 269 + 1 = 270.

dimana
mean (hr) dan
standar deviasi, sd(hr) dihitung langsung dari data.
Seandainya kita belum punya data sama sekali, namun kita ingin mengetahui power jika akan menggunakan sampel berukuran 270, dengan rerata pengamatan kita nanti tidak jauh berbeda nilai dugaan kita (delta = 0.3), perkiraan standar deviasi 1.5, dan tingkat signifikansi 5%, maka dengan prosedur berikut:

diperoleh power = 0.906. Cukup besar.
Akan tetapi, katakan kita ingin power yang lebih besar, misal 99%. Berapakah ukuran sampel yang diperlukan?

Ternyata diperlukan paling tidak 462 pengamatan untuk power sebesar itu. Wajar saja, bukan?
No pain, no gain. Ingin hasil meyakinkan, bekerjalah lebih keras, kumpulkan data lebih banyak.
Jika ada pertanyaan lebih lanjut, atau saran maupun komentar, silakan tinggalkan pesan ya :)
No comments:
Post a Comment
Relevant & Respectful Comments Only.