Sehingga, untuk melakukan inferensi, diperlukan asumsi awal (prior) dan tambahan informasi dari data (likelihood) untuk kemudian menghasilkan informasi terbaharukan (update).
Maka, selanjutnya kita bahas dahulu komponen – komponen tersebut.
Likelihood:
Untuk sampel berukuran ,
(2)
Posterior
Dari pembahasan sebelumnya, dengan
Data: dapat diinterpretasikan sebagai banyaknya pengamatan prior, dan
sebagai penjumlahan nilai dari pengamatan prior tersebut.
Misal akan dibandingkan kedua kementrian tersebut berdasarkan jumlah kasus korupsi yang berhasil diungkap.
Maka, modelnya adalah:
, untuk lembaga A
, untuk lembaga B.
Jika parameter
Grafik distribusi prior (sama untuk A dan B) dan posterior dapat diperoleh sebagai berikut:
Dan diperoleh hasil
[caption id="attachment_2742" align="aligncenter" width="401"]
Distribusi dari parameter theta (hitam = prior, merah dan biru = posterior untuk A dan B)[/caption]
Intepretasi:
Terlihat bahwa likelihood cukup berperan meng-update informasi dari prior, sebagaimana ditunjukkan oleh distribusi posterior (A = merah, B = biru) yang berbeda dengan distribusi prior (hitam). Grafik tersebut juga mengindikasikan bahwa jumlah kasus korupsi secara rata – rata ( di lembaga A relative lebih sedikit daripada di lembaga B (grafik merah di sebelah kiri grafik biru ().
Tapi itu kan secara rata – rata, gambaran umum. Bagaimana untuk prediksi, kasus per kasus? Apakah lembaga A , dengan kebijakan e-budgeting, memang memiliki kasus korupsi yang lebih sedikit dibanding lembaga B?
Untuk menjawab hal ini, kita dapat menghitung peluang terjadinya hal tersebut menggunakan posterior predictive distribution. Sebagaimana telah ditunjukkan di atas, distribusi binomial negative merupakan posterior predictive distribution dari
pA adalah peluang terjadinya kasus korupsi di lembaga A, dan pB untuk hal yang sama di lembaga B. Penyajian grafis di bawah ini:
[caption id="attachment_2744" align="aligncenter" width="381"]
Posterior predictive probabilitas untuk ditemukannya kasus korupsi pada lembaga A (hitam) dan lembaga B (merah).[/caption]
Intepretasi:
Dari plot di atas terlihat bahwaprobabilitas untuk tidak ditemukannya kasus korupsi di lembaga A jauh lebih tinggi daripada lembaga B, hampir sama untuk 1 kasus korupsi, dan untuk lebih dari 1 kasus lebih berpeluang untuk terjadi di lembaga B.
Data untuk contoh dapat diunduh di sini (data-korupsi).
Syntax R dapat diunduh di sini (model-poisson_syntax).
No comments:
Post a Comment
Relevant & Respectful Comments Only.