“METODE BOOTSTRAP”


Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Sering kita dihadapkan pada permasalahan, hanya mendapatkan jumlah sampel yang kecil dalam suatu pemodelan dan dikhawatirkan parameter yang diperoleh bias, underestimate atau overestimate.

Sebenarnya ada sebuah solusi atas permasalahan ini, yaitu Metode bootstrap. Pada pertengahan 1970, Efron memperkenalkan Metode Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui bentuknya. Bootstrapping ini merupakan teknik modifikasi dari Jacknife yang diperkenalkan oleh Queneiville pada tahun 1948. Berhubung metode ini pada awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap dikenal sebagai data driven approach. Pada dekade 80-an perkembangan metode nonparametrik mulai sering digunakan seperti pada regresi nonparametrik, estimasi distribusi dengan kernel, dan neural network.

Metode bootstrap adalah metode berbasis resampling data sampel dengan syarat pengembalian pada datanya dalam menyelesaikan statistik ukuran suatu sampel dengan harapan sampel tersebut mewakili data populai sebenarnya, biasanya ukuran resampling diambil secara ribuan kali agar dapat mewakili data populasinya. Bootstrap memungkinkan seseorang untuk melakukan inferensi statistik tanpa membuat asumsi distribusi yang kuat dan tidak memerlukan formulasi analitis untuk distribusi sampling suatu estimator. Sebagai pengganti, bootstrap menggunakan distribusi empiris untuk mengestimasi distribusi sampling. Jadi jika penyelesaian analitik tidak mungkin dilakukan dimana anggapan (suatu distribusi, misalnya kenormalan data) tidak dipenuhi maka dengan menggunakan Boosttrap masih dapat dilakukan suatu inferensi.

Dasar pendekatan Bootstrap adalah dengan memperlakukan sampel sebagai populasi dan dengan menggunakan sampling Monte Carlo untuk membangkitkan dan mengkonstruksi estimator empiris dari distribusi sampling statistik. Distribusi sampling dapat dipandang sebagai harga-harga statistik yang dihitung dari sejumlah tak terhingga sampel random berukuran n dari suatu populasi yang diberikan. Sampling Monte Carlo mengambil konsep ini untuk membangun distribusi sampling suatu estimator dengan mengambil sejumlah besar sampel erukuran n secara random dari populasi dan menghitung statistik tersebut dari harga-harga distribusi sampling tersebut. Estimasi Monte Carlo yang sebenarnya memerlukan pengetahuan tentang seluruh populasi yang tidak mungkin selalu tersedia dalam prakteknya karena yang dipunyai dari hasil riset praktek adalah sampel dari populasi oleh karena itu dilakukan inferensi untuk Tetha dari distribusi samplingnya.

Pendekatan bootstrap dilakukan dengan proses resampling pada observasi dan residual dari model regresi :

  1. Apabila regresor adalah random, metode bootstrap yang dipakai adalah dengan melakukan resampling pada observasi dengan probabilitas setiap observasi akan terambil sebanyak 1/n untuk jumlah sampel (i) = 1,2,…, n dan untuk sejumlah variabel (j) = 1,2,…,k. Resampling dilakukan sebanyak B kali. Dimana jumlah B diisyaratkan cukup besar, hingga diperoleh estimasi parameter yang konvergen atau bahkan sampai sejumlah n pangkat n sampel. Dengan jumlah B yang cukup besar ini, diharapkan estimasi parameter regresi yang dihasilkan akan lebih kuat (robust).
  2. Apabila regresor adalah variabel yang fix, metode bootstrap yang dipakai adalah dengan melakukan resampling pada residual (hasil bentukan model OLS, pada sampel). Dari nilai residual ini selanjutnya diestimasikan parameter model regresi. Proses ini dilakukan berulang sampai sebanyak B kali.

Baik pada regresor yang fix maupun random, estimasi parameter regresi (beta), diperoleh dengan menjumlahkan beta pada setiap resampling dan membagi dengan nila B. Jadi merupakan rata-rata dari taksiran beta di setiap proses resampling.

Apakah hanya bootstrap ?

Ada lagi metode resampling yang lain, yakni dengan pendekatan jacknife. Jacknife resampling lebih umum digunakan apabila variabel regressor adalah fix. Ada dua cara dalam proses jacknife resampling, yaitu :

  1. Estimasi parameter dengan OLS, namum menghilangkan satu per satu observasi, dilakukan berulang sampai (n-1) kali dan mencari taksiran parameter dari rata-rata parameter (beta) setiap kali resampling dilakukan.
  2. Estimasi model dengan menghilangkan d-observasi sekaligus, dilakukan berulang sampai sebanyak S kali, dimana S (S = n kombinasi d). Taksiran parameter diperoleh dengan merata-ratakan parameter yang diperoleh disetiap kali resampling.

Menggunakan boostrap atau jacknife ? Adalah sebuah pilihan, bergantung pada kasus yang dihadapi. Sekedar mengetahui estimasi parameter, atau perlu membangkitkan sejumlah data untuk mendapatkan estimasi parameter dan estimasi varians lebih robust.

Metode bootstrap dapat digunakan untuk berbagai hal, salah satu adalah menentukan nilai t statistik seperti yg dilakukan dalam model SEM Partial Least Square. Denga metode bootstarp atau melakukan resampling sampai 500 kali, maka kita dapat menghitung nilai standard error (SE) jika dikatehui standart errornya, maka kita dapat menghitung nilai t statistik dengan membagi koefisien regresi dengan standar errornya. Hanya setiap kali anda melakukan bootstrap nilai t statistik akan berbeda-beda karena menggunakan iterasi yang dilakukan secara random, tetapi dengan bootstraping 500 kali umunya hasilnya stabil sehingga jika dilihat dari nilai signifikansi statistik akan konsisten hasilnya walaupun nilai t berbeda-beda.

 

Posted by : NURUL FITRIYANI (uyu fitriyani marshanda) ~ G1D 008 030

111 comments

  1. ung uyu coba ditambahin gambar apa ke’ psti ndak tulisan smua jdnya..hee…
    palagi kL gmbrnya wrna ungu psti unyu…unyu…

  2. rada bingung maksudna apa seh …n statistik termasuk pelajaran yg butuh konsentrasi tinggi buat driq….tapi thanks bgt buat nambah ilmu…tapi buat tugas apaan neh

  3. ee mtk bgt ne,,
    bosen dgan bace laun,,
    ne hnya bcaan ank mtk ja jd ny,,
    tp nice post lah,,he:)

    • eeeeee. lemah dayat niii..
      statistik tu ga slamanya berat boss..
      kalo kita nikmatin bisa jadi hal yg menyenangkan đŸ˜€

    • bisa bisaaaa đŸ˜€
      ntar giginya bisa di estimasi, kira2 berapa panjang kawat yg hrus d pake..
      stuju tyo???? đŸ˜€

  4. say… gmbarnya kok pke tanda tanya si… seharusnya pke smile dunkzz… kita fun with statistika… ^_^

  5. nah,,,,,saya gak bisa math…tapi setelah baca,,,tetep gak bisa,,,,wakakakakakaka…..
    nice info sista…..

      • hahahahahaha,,,,padahal saya dapet A statistik kemarin,,,,,,,,ah males belajar lagi….wakakakakakaka

  6. wah canggih banget neh ilmu,,ajaib banget dah pokoknya….

    rugi lok kagak dipelajari lebih mendalam lagi….

    ada yg mw ajarin gua kagak…??!

  7. hhmmm…canggih…enak juga neh org matematik dajak kerjsama nnt klo penelitian…siap gak Bu???

  8. gk pgel ngelakuin tes bootstraping sampe 500 kali,,,
    trusssss,,, gi mn mw dikatakan konsisten klo hasil nilai t berbeda2…

    • eeeee kakkakakkkk..
      namanya juga ngelakuin estimasi..
      diambil pendekatannyaaa..
      hhehehee..
      btw, thanks đŸ˜€

    • alhamdulillah..
      amin..
      smoga bs jd Master Mesin jg..
      thanks for liking đŸ™‚

      butuh kesabaran juga sapppp*..
      smgt!

  9. apa blh bertanya??

    saya boleh tidak minta penjelasan lebih mendalam mengenai jackknife??
    seperti :
    1. jackknife itu sebenarnya digunakan untuk menduga apa??
    2. apakah jackknife hanya digunakan untuk data kecil??
    3. tujuan jackknife sendiri apa? ( tapi bukan untuk regresi )

    mohon dibantu jawaban atas pertanyaan saya.. trims… đŸ™‚

    • maaf kalo ung juga lagi belajar..

      tapi sepengetahuan ung, jackknife itu bisa di pake untuk menduga apa aja, misal nya bias, parameter regresi, interva kepercayaan parameter populas (misalnya mean, median, proporsi, dll).

      nah, untuk data kecil, sepertinya ga cuma untuk data kecil. tapi bisa untuk mempermudah kalo kita punya data kecil..

      tujuan jackknife, sepengetahuan ung, untuk memperkecil bias dari estimator yang di estimasi..

      • kemudian maksud dari sebaran populasi yg tidak diketahui itu gimana yaa ung??

        dan sebaran populasi itu sendiri pengertiannya apa?

        tengkiuu…. đŸ™‚

  10. maaf mau tanya, saya sedang bingung mengenai cara estimasi parameter menggunakan algoritma EM,apakah anda bisa menjelaskan mengenai caranya? terima kasih

Tinggalkan Balasan ke uyu ~ ung Batalkan balasan