A statistics professor was describing sampling theory to his class, explaining how a sample can be studied and used to generalize to a population. One of the student in the back of the room kept shaking his head. "What's the matter?" asked the professor. "I don't believe it," said the student, "why not study the whole population in the first place?" The professor continued explaining the ideas of random and representative samples. The student still shook his head.
The professor launched into the mechanics of proportional stratified samples, randomized cluster sampling, the standard error of the mean, and the central limit theorem. The student remained unconvinced saying, "Too much theory, too risky, I couldn't trust just a few numbers in place of ALL of them."
Attempting a more practical example, the professor then explained the scientific rigor and meticulous sample selection of the Nielsen television ratings which are used to determine how multiple millions of advertising dollars are spent. The student remained unimpressed saying, "You mean that just a sample of a few thousand can tell us exactly what over 250 MILLION people are doing?"
Finally, the professor, somewhat disgruntled with the scepticism, replied, "Well, the next time you go to the campus clinic and they want to do a blood test...tell them that's not good enough...tell them to TAKE IT ALL!!"
(Kenn Finstuen)
Untuk apa dan bagaimanakah proses pengambilan sampel dilakukan?
Perhatikan bagan berikut.
Perhatikan skenario berikut.
- Ingin diketahui pola konsumsi daging sapi di masyarakat di kota - kota berikut: Jakarta, Bandung, Surabaya dan Bali.
--> populasi teoritis (target) : masyarakat di 4 kota tersebut.
- Akan tetapi, karena beberapa kondisi, peneliti hanya bisa mengakses sebagian dari masyarakat di kota - kota tersebut, dari data dinas kependudukan.
--> populasi studi: masyarakat yang tercatat di dinas kependudukan.
--> sampling frame: daftar anggota masyarakat yang tercatat di dinas kependudukan 4 kota tersebut
- Peneliti akhirnya mengambil data dari sebagian anggota masyarakat yang tercatat di dinas kependudukan.
--> sample: anggota masyarakat yang disurvei oleh si peneliti.
Lalu bagaimana memilih siapa akan menjadi sampel?
Gunakan metode pengambilan sampel. Secara umum, terbagi menjadi 2 yaitu
non-probability sampling (silakan baca di
sini), dan
probabilty sampling.
Apa itu probability sampling?
Suatu metode pengambilan sampel dengan suatu proses seleksi acak. Suatu prosedur harus dibuat untuk menjamin keacakan tersebut, dimana setiap unit di populasi mempunyai peluang yang sama untuk terpilih.
Apa itu unit?
Pada contoh skenario di atas, bisa berupa rumah tangga (jika fokus pada pola konsumsi rumah tangga), atau bisa juga 1 individu (jika fokus pada pola konsumsi individu).
Apa saja yang termasuk dalam probability sampling?
Simple random sampling
Kapan digunakan?
Biasanya pada percobaan sederhana, dimana tersedia sampling frame yang memuat keseluruhan anggota populasi. Setiap orang atau subjek pada sampling frame harus bisa diakses.
Bagaimana caranya?
Pilih secara acak dari daftar pada sampling frame. Yang berarti, setiap unit sampel harus memiliki suatu identitas (misal penomoran). Pemilihan bisa dengan menggunakan pengocokan (tidak
up-to-date dan tidak efisien pada populasi dengan ukuran besar), atau bilangan acak.
Contoh
Pada skenario di atas, misalkan sampling frame berisi daftar 10.000 rumah tangga. Jika menggunakan
Excel, buat 1 kolom baru, sebut
RAND. Lakukan seperti yang tertera pada gambar, kemudian klik kanan atau
double klik pada pojok kanan bawah sel tersebut, maka otomatis akan dihasilkan bilangan random untuk 10.000 rumah tangga tersebut.
Untuk menghindari berubah-ubahnya bilangan random setiap kali melakukan sesuatu di lembar kerja tersebut, ada baiknya kolom tersebut di-
copy --> paste special --> paste values.
Misalkan akan dipilih 1.000 rumah tangga secara acak. Ambillah 1.000 rumah tangga yang berasosiasi dengan 1.000 bilangan acak terkecil (atau terbesar), dengan perintah
sort data seperti pada gambar. Rumah tangga 2, 4, 10.000, 8, 10, 5, dan 9 merupakan 7 dari 1.000 yang akan dipilih.
Diskusi
Keunggulan dari metode ini adalah:
- Tak bias, karena setiap unit memiliki peluang terpilih yang sama.
- Independen: terpilihnya suatu unit tidak bergantung pada terpilihnya unit yang lain.
Akan tetapi, dalam pelaksanaanya tidak selalu mudah untuk mendapatkan informasi dari unit yang terpilih. Bisa jadi rumah tangga 2 mudah diakses, namun perlu upaya yang besar untuk menjangkau rumah tangga 10.000, bisa jadi karena jauhnya lokasi atau ternyata mereka tidak mau dijadikan responden.
Systematic sampling
Kapan digunakan?
Ketika sulit untuk mengidentifikasi subjek pada simple random sampling. Misal, kesulitan melakukan pengacakan (generate bilangan acak) untuk semua subjek pada daftar. Lebih mudah untuk memilih setiap subjek yang ke-n, untuk n suatu bilangan bulat.
Bagaimana caranya?
Pada skenario di atas, misal akan dipilih 1000 rumah tangga.
Maka, pilih secara acak di antara 10.000/1.000 = 10 rumah tangga pertama, kemudian pilih setiap rumah tangga ke-10 dari rumah tangga yang terpilih.
Misal, terpilih rumah tangga 7.
Maka sampel ukuran 1.000 akan mencakup rumah tangga: 7, 17, 27, ..., 9997.
Diskusi
Metode ini hanya bagus diterapkan jika setiap unit pada daftar tersusun secara acak.
Jika misalnya pada kasus lain, pemilihan 100 pegawai dari daftar 1000 pegawai suatu perusahaan, dan terpilih pegawai no.urut 1, 101, 201, ... . Jika ternyata setiap departemen di perusahaan tersebut masing - masing memiliki 100 staf, dan pada penyusunan daftar pegawai di nomor urut 1 dari tiap departemen selalu untuk manajer, maka sampel yang terpilih tidaklah representatif.
Cluster sampling dan Stratified sampling
Untuk pembahasan mengenai
cluster sampling dan
stratified sampling, perhatikan ilustrasi berikut.
Misalkan ingin dipelajari mengenai kehidupan serangga, dan akan dipilh beberapa spesies untuk mewakili, seperti pada gambar.
Skenario pertama diwakili oleh gambar pada kotak. Ada dua lokasi pengamatan, di mana keberadaan spesies serangga pada masing - masing lokasi diwakili oleh masing - masing kotak.
Skenario kedua diwakili oleh gambar pada oval. Setiap spesies memiliki kecenderungan untuk memilih tempat tinggal yang berbeda, sehingga kelima spesies tersebut tersebar di lima lokasi yang berbeda.
Bagaimana memilih serangga supaya kelima spesies tersebut dapat terwakili?
Pada skenario 1: Pilih secara acak 1 lokasi, amati semua spesies pada lokasi tersebut.
Pada skenario 2: Pilih semua lokasi, kemudian pilih secara acak masing - masing wakil dari spesies pada lokasi tersebut.
Skenario 1 disebut
cluster sampling.
Skenario 2 disebut
stratified sampling.
Berdasarkan skenario tersebut, dapatkah kamu definisikan dan bandingkan apa persamaan dan perbedaan kedua metode tersebut?
Multi-stage sampling
Dalam pelaksanaannya, pengambilan data tidaklah semudah pembahasan kita di atas. Terkadang, 1 metode tidak cukup untuk menjamin keterwakilan dari data yang diambil. Sehingga, perlu tahapan - tahapan dan kombinasi dari beberapa metode untuk mengatasi hal tersebut.
Misal untuk contoh skenario penelitian pola konsumsi daging di 4 kota besar di atas.
Sulit sekali untuk menerapkan
simple random sampling secara langsung, kalaupun misalnya daftar seluruh rumah tangga di kota - kota tersebut tersedia.
Untuk lebih efisien, salah satu contoh kemungkinan rancangan adalah sebagai berikut:
- Pada setiap kota, bagi data per-kotamadya atau kabupaten.
<
p style="padding-left: 30px;">Jika setiap kotamadya atau kabupaten diduga memiliki karakteristik yang serupa terkait dengan masalah
penelitian, maka pilih secara acak 1 kotamadya/kabupaten (cluster sampling) . Jika tidak demikian, pilih
kotamadya/kabupaten dengan dari masing - masing karakteristik yang berbeda (stratified sampling).
- Dari kotamadya atau kabupaten yang terpilih, ulangi langkah di atas, hingga ke tingkat terendah yang kita
inginkan, misal tingkat RW atau RT.
- Pada tingkat RT, baru kemudian terapkan simple random sampling atau systematic sampling untuk memilih unit rumah tangga yang akan menjadi sampel kita.
Tidak ada komentar:
Posting Komentar
Relevant & Respectful Comments Only.