Heterokedastisitas


 

Dalam statistik, ilmu data, dan pembelajaran mesin, heteroskedastisitas terjadi ketika kesalahan standar suatu variabel, yang dipantau selama jangka waktu tertentu, tidak konstan.

 

Heteroskedastisitas sering muncul dalam dua bentuk: bersyarat dan tidak bersyarat.

Heteroskedastisitas bersyarat adalah cara untuk menemukan volatilitas tidak konstan ketika tidak mungkin memprediksi kapan volatilitas akan tinggi atau rendah di masa mendatang.

Heteroskedastisitas tanpa syarat digunakan untuk mengidentifikasi periode volatilitas tinggi dan rendah di masa depan.

Dalam analisis regresi dan analisis varians, heteroskedastisitas merupakan masalah besar karena membuat uji signifikansi statistik yang menganggap semua kesalahan pemodelan memiliki varians yang sama menjadi sia-sia

Meskipun penaksir kuadrat terkecil biasa masih adil ketika ada heteroskedastisitas, itu lebih baik daripada menggunakan kuadrat terkecil yang digeneralisasikan.

Outlier, kesalahan pengukuran, dan variabel yang dihilangkan dapat menyebabkan heteroskedastisitas.

Menemukan dan memperbaiki heteroskedastisitas penting untuk memastikan bahwa hasil statistik akurat dan valid.

Heteroskedastisitas dapat diperhitungkan, dan model statistik dapat dibuat lebih akurat dengan menggunakan teknik seperti kuadrat terkecil tertimbang atau regresi kuat.

Dengan memahami dan memperhitungkan heteroskedastisitas, peneliti dan ilmuwan data dapat membuat prediksi dan wawasan yang lebih akurat dan andal dari data mereka.

Contoh:

Berat badan dan tinggi badan: Variasi berat badan bertambah seiring dengan bertambahnya tinggi badan, sehingga terjadi heteroskedastisitas pada data yang menganalisis hubungan antara kedua variabel tersebut.

Harga rumah: Variabilitas harga rumah seringkali lebih tinggi untuk properti mahal daripada properti yang lebih murah, menyebabkan heteroskedastisitas dalam data harga rumah.

Salah satu contoh heteroskedastisitas favorit saya adalah keterlibatan media sosial. Variabilitas dalam keterlibatan media sosial cenderung lebih tinggi untuk postingan yang menjadi viral atau akun dengan pengikut yang lebih besar, sehingga terjadi heteroskedastisitas pada data media sosial.

Disadur dari: https://www.linkedin.com/feed/update/urn:li:activity:7040901798102020096/

Tidak ada komentar:

Posting Komentar

Relevant & Respectful Comments Only.