“METODE BOOTSTRAP”


Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Sering kita dihadapkan pada permasalahan, hanya mendapatkan jumlah sampel yang kecil dalam suatu pemodelan dan dikhawatirkan parameter yang diperoleh bias, underestimate atau overestimate.

Sebenarnya ada sebuah solusi atas permasalahan ini, yaitu Metode bootstrap. Pada pertengahan 1970, Efron memperkenalkan Metode Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstrapping ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneiville pada tahun 1948. Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode nonparametrik mulai sering digunakan seperti pada regresi nonparametrik, estimasi distribusi dengan kernel, dan neural network.

Metode bootstrap adalah metode berbasis resampling data sampel dengan syarat pengembalian pada datanya dalam menyelesaikan statistik ukuran suatu sampel dengan harapan sampel tersebut mewakili data populai sebenarnya, biasanya ukuran resampling diambil secara ribuan kali agar dapat mewakili data populasinya. Bootstrap memungkinkan seseorang untuk melakukan inferensi statistik tanpa membuat asumsi distribusi yang kuat dan tidak memerlukan formulasi analitis untuk distribusi sampling suatu estimator. Sebagai pengganti, bootstrap menggunakan distribusi empiris untuk mengestimasi distribusi sampling. Jadi jika penyelesaian analitik tidak mungkin dilakukan dimana anggapan (suatu distribusi, misalnya kenormalan data) tidak dipenuhi maka dengan menggunakan Boosttrap masih dapat dilakukan suatu inferensi.

Dasar pendekatan Bootstrap adalah dengan memperlakukan sampel sebagai populasi dan dengan menggunakan sampling Monte Carlo untuk membangkitkan dan mengkonstruksi estimator empiris dari distribusi sampling statistik. Distribusi sampling dapat dipandang sebagai harga-harga statistik yang dihitung dari sejumlah tak terhingga sampel random berukuran n dari suatu populasi yang diberikan. Sampling Monte Carlo mengambil konsep ini untuk membangun distribusi sampling suatu estimator dengan mengambil sejumlah besar sampel erukuran n secara random dari populasi dan menghitung statistik tersebut dari harga-harga distribusi sampling tersebut. Estimasi Monte Carlo yang sebenarnya memerlukan pengetahuan tentang seluruh populasi yang tidak mungkin selalu tersedia dalam prakteknya karena yang dipunyai dari hasil riset praktek adalah sampel dari populasi oleh karena itu dilakukan inferensi untuk Tetha dari distribusi samplingnya.

Pendekatan bootstrap dilakukan dengan proses resampling pada observasi dan residual dari model regresi :

  1. Apabila regresor adalah random, metode bootstrap yang dipakai adalah dengan melakukan resampling pada observasi dengan probabilitas setiap observasi akan terambil sebanyak 1/n untuk jumlah sampel (i) = 1,2,…, n dan untuk sejumlah variabel (j) = 1,2,…,k. Resampling dilakukan sebanyak B kali. Dimana jumlah B diisyaratkan cukup besar, hingga diperoleh estimasi parameter yang konvergen atau bahkan sampai sejumlah n pangkat n sampel. Dengan jumlah B yang cukup besar ini, diharapkan estimasi parameter regresi yang dihasilkan akan lebih kuat (robust).
  2. Apabila regresor adalah variabel yang fix, metode bootstrap yang dipakai adalah dengan melakukan resampling pada residual (hasil bentukan model OLS, pada sampel). Dari nilai residual ini selanjutnya diestimasikan parameter model regresi. Proses ini dilakukan berulang sampai sebanyak B kali.

Baik pada regresor yang fix maupun random, estimasi parameter regresi (beta), diperoleh dengan menjumlahkan beta pada setiap resampling dan membagi dengan nila B. Jadi merupakan rata-rata dari taksiran beta di setiap proses resampling.

Apakah hanya bootstrap ?

Ada lagi metode resampling yang lain, yakni dengan pendekatan jacknife. Jacknife resampling lebih umum digunakan apabila variabel regressor adalah fix. Ada dua cara dalam proses jacknife resampling, yaitu :

  1. Estimasi parameter dengan OLS, namum menghilangkan satu per satu observasi, dilakukan berulang sampai (n-1) kali dan mencari taksiran parameter dari rata-rata parameter (beta) setiap kali resampling dilakukan.
  2. Estimasi model dengan menghilangkan d-observasi sekaligus, dilakukan berulang sampai sebanyak S kali, dimana S (S = n kombinasi d). Taksiran parameter diperoleh dengan merata-ratakan parameter yang diperoleh disetiap kali resampling.

Menggunakan boostrap atau jacknife ? Adalah sebuah pilihan, bergantung pada kasus yang dihadapi. Sekedar mengetahui estimasi parameter, atau perlu membangkitkan sejumlah data untuk mendapatkan estimasi parameter dan estimasi varians lebih robust.

Metode bootstrap dapat digunakan untuk berbagai hal, salah satu adalah menentukan nilai t statistik seperti yg dilakukan dalam model SEM Partial Least Square. Denga metode bootstarp atau melakukan resampling sampai 500 kali, maka kita dapat menghitung nilai standard error (SE) jika dikatehui standart errornya, maka kita dapat menghitung nilai t statistik dengan membagi koefisien regresi dengan standar errornya. Hanya setiap kali anda melakukan bootstrap nilai t statistik akan berbeda-beda karena menggunakan iterasi yang dilakukan secara random, tetapi dengan bootstraping 500 kali umunya hasilnya stabil sehingga jika dilihat dari nilai signifikansi statistik akan konsisten hasilnya walaupun nilai t berbeda-beda.

 

Posted by : NURUL FITRIYANI (uyu fitriyani marshanda) ~ G1D 008 030

111 comments

  1. Ada syntax software untuk analisis regresi menggunakan metode bootstrap? khususnya boorstrap paired, kalo ada dan berkenan saya mau minta syntaxnya. Terimakasih

  2. sangat membantu saya dalam menambah pengetahuan mengenai metode Bootstrap, rencana saya akan membangun sebuah website menggunakan metode ini, terimakasih penjelasannya

Tinggalkan komentar