Minggu, 08 Februari 2015

Distribusi Sampling I

Pada penulisan Ketujuh tentang Statistika Elementer ini, penulis akan memberikan bahasan mengenai Distribusi Sampling bagian pertama kepada para pembaca untuk menambah pengetahuan dan pemahaman mengenai Distribusi Sampling yang menjadi fokus penting dalam kuantitas dari sampel mean untuk bahasan materi selanjutnya, yaitu Estimasi Interval Parameter dan Pengujian Hipotesis. Pada bahasan ini, Distribusi Sampling yang diberikan adalah Distribusi Sampling Mean dan Distribusi Sampling Selisih Dua Mean.


Kebutuhan akan Distribusi Sampling.

Dalam statistika inferensi, terdapat hal penting dalam menyimpulkan Populasi yang menjadi perhatian peneliti ketika hal ini menjadi tidak mungkin untuk mengamati seluruh himpunan pengamatan yang membangun populasi. Sebagai contoh, percobaan untuk menentukan rata-rata dari masa hidup suatu jenis bola lampu; Hal ini menjadi tidak mungkin untuk menguji semua bola lampu yang diproduksi, sehingga peneliti pasti akan menggunakan sebagian pengamatan dari populasi (Sampel) untuk membuat inferensi mengenai populasi. Hal ini yang membuat peneliti mempertimbangkan kebutuhan dari Sampling. Jika inferensi yang diberikan dari sampel untuk populasi bernilai valid, maka sampel tersebut akan menjadi sampel yang Representatif (mampu menggambarkan populasi)[1]. Namun, peneliti tidak bisa memastikan secara sempurna untuk inferensi ini, sehingga diberikan suatu Sampling Error yang mengukur kesalahan dari penggunaan suatu sampel untuk menduga karakteristik populasi[2].


Distribusi Sampling.

Distribusi Sampling adalah distribusi probabilitas dari suatu Statistik (yaitu semua pengamatan yang mungkin dari statistik untuk sampel dari suatu ukuran sampel yang diberikan)[2]. Pada penulisan ini, diberikan distribusi sampling sebagai review statistik, meliputi:

  1. Distribusi Sampling Mean.
  2. Distribusi Sampling Selisih Dua Mean.

Distribusi Sampling Mean.

Distribusi Sampling Mean adalah distribusi sampling untuk mean sampel (Xbar) dari suatu populasi berukuran N. Mean sampel ini berdistribusi Normal dengan mean µXbar dan varian σXbar2.

Secara khusus dalam distribusi sampling mean terdapat dua prinsip penting, antara lain[2]:

  1. Jika sampel diambil dengan pengembalian dari populasi terhingga, maka berlaku
  2. Jika sampel diambil tanpa pengembalian dari populasi terhingga, maka berlaku

Standar deviasi dari Xbar menunjukkan besarnya Sampling Error yang diharapkan ketika populasi Mean diestimasi oleh mean sampel (Xbar), sehingga ukuran ini sering disebut sebagai standard error dari mean sampel (Xbar). Secara umum, standar deviasi dari suatu Statistik (untuk pendugaan parameter) disebut sebagai standard error (SE) dari suatu Statistik[2].
Jika peneliti melakukan sampling dari populasi dengan distribusi tidak diketahui (baik terhingga maupun tak terhingga), distribusi sampling Xbar akan mendekati distrbusi Normal dengan mean μ and varian σ2/n pada ukuran sampel sangat besar (n -> ∞). Hal ini sangat berkaitan atau sesuai dengan teorema yang disebut Central Limit Theorem (CLT)[1].
Central Limit Theorem:

Secara empiris[1], pendekatan distribusi Normal untuk Xbar akan secara umum baik jika ukuran n ≥ 30, dengan diberikan distribusi populasi yang tidak miring (skewed). Jika n < 30, maka pendekatan distribusi Normal baik hanya jika populasi tidak terlalu berbeda dari distribusi Normal. Jika populasi diketahui berdistribusi Normal, maka distribusi Sampling Xbar akan mengikuti distribusi Normal secara tepat, serta tidak tergantung berapa kecil ukuran sampel.
Sebagai Contoh, diberikan kasus waktu transportasi bus untuk perjalanan antara dua kampus dari suatu Universitas. Waktu transportasi bus tersebut memiliki rata-rata sebesar 28 menit dan standar deviasi 5 menit. Pada bulan tertentu, bus tersebut digunakan untuk mengantar penumpang sebanyak 40 kali. Berapa probabilitas rata-rata waktu transportasi bus tersebut lebih dari 30 menit?
Penyelesaian:
Diberikan µ = 28 dan σ = 5 , serta ukuran sampel n = 40 dan xbar = 30.

Selanjutnya probablilitas ini diselesaikan dengan bantuan Tabel Normal Standar.

maka

Probabilitas ini bernilai sangat kecil, maka peneliti dapat menduga bahwa rata-rata waktu transportasi bus tersebut tidak lebih dari 30 menit.

Teorema untuk Distribusi t :

Catatan untuk Distribusi t:

  • Distribusi t dapat diterapkan pada ukuran sampel baik kecil maupun besar. Secara empiris, ukuran sampel kecil adalah n ≤ 30.
  • Pada ukuran sampel sangat besar (n -> ∞), bentuk kurva distribusi t mendekati distribusi Normal Standar (Z).

Sebagai Contoh, diberikan kasus waktu transportasi bus untuk perjalanan antara dua kampus dari suatu Universitas. Waktu transportasi bus tersebut memiliki rata-rata sebesar 28 menit. Pada bulan tertentu, bus tersebut digunakan untuk mengantar penumpang sebanyak 40 kali, sehingga diperoleh standar deviasi sampel sebesar 5,5 menit. Berapa probabilitas rata-rata waktu transportasi bus tersebut lebih dari 30 menit?
Penyelesaian:
Diberikan µ = 28, serta ukuran sampel n = 40, s = 5,5 , v = n – 1 = 39, dan xbar = 30.

Selanjutnya probablilitas ini diselesaikan dengan bantuan Software Excel.

Langkah-langkah penyelesaian dengan Software Excel:

  1. Inputkan nilai t = 2.30 kedalam cell A2 dan nilai v = 39 kedalam cell B2.
  2. Inputkan juga suatu Formula kedalam cell C2, yaitu: =TDIST(A2,B2,1) .

maka diperoleh hasil

Probabilitas ini bernilai sangat kecil, maka peneliti dapat menduga bahwa rata-rata waktu transportasi bus tersebut tidak lebih dari 30 menit ketika standar deviasi populasi tidak diketahui.


Distribusi Sampling Selisih Dua Mean.

Distribusi sampling mean biasanya digunakan peneliti untuk meneliti satu populasi saja. Terkadang peneliti juga tertarik meneliti pengamatan dari dua populasi dengan tujuan untuk melakukan perbandingan antara populasi pertama dan populasi kedua. Dasar untuk perbandingan itu adalah Selisih Dua Mean (μ1μ2) yang menggambarkan perbedaan dalam makna populasi.
Misalkan terdapat dua populasi, yaitu: populasi pertama memiliki mean μ1 dan varian σ12, dan populasi kedua mempunyai mean μ2 dan varian σ22. Misalkan juga statistik Xbar1 merupakan mean dari sampel acak berukuran n1 yang dipilih dari populasi pertama, dan statistik Xbar2 adalah mean dari sampel acak berukuran n2 yang diambil dari populasi kedua. Sampel dari populasi pertama independen terhadap sampel dari populasi kedua. Distribusi Sampling Selisih Dua Mean adalah distribusi sampling untuk selisih dua mean sampel (Xbar1 – Xbar2) dari dua populasi yang masing-masing berukuran N1 dan N2. Selisih dua mean sampel ini berdistribusi Normal dengan mean µXbar1–Xbar2 dan varian σXbar1-Xbar22.

Sebagaimana dalam distribusi sampling mean sebelumnya, maka juga berlaku dua prinsip penting terkait distribusi sampling ini.

  1. Jika sampel diambil dengan pengembalian dari 2 populasi terhingga, maka berlaku
  2. Jika sampel diambil tanpa pengembalian dari 2 populasi terhingga, maka berlaku

Central Limit Theorem (CLT)[1] juga dapat dengan mudah diterapkan untuk kasus distribusi sampling selisih dua mean.

Secara empiris[1], jika n1 dan n2 lebih besar atau sama dengan 30, maka pendekatan distribusi Normal untuk distribusi Xbar1 – Xbar2 akan sangat baik ketika distribusi yang mendasari tidak terlalu jauh dari distribusi Normal. Ketika n1 dan n2 kurang dari 30, pendekatan Normal baik ketika populasi tidak berbeda jauh dari distribusi Normal.
Sebagai Contoh, diberikan kasus perbandingan Waktu Kering dari dua tipe Cat yang berbeda (independen). Delapanbelas sampel media dicat dengan Cat tipe A dan ditunggu beberapa jam sampai kering kemudian dicatat, selanjutnya perlakuan ini dilakukan sama untuk pencatatan hasil Waktu Kering Cat tipe B. Standar deviasi populasi dari dua sampel ini sama-sama bernilai 1. Dengan mengasumsikan mean Waktu Kering sama untuk dua tipe cat ini, temukan probabilitas P(XbarA – XbarB > 1) dengan Xbar1 dan Xbar2 merupakan mean sampel Waktu Kering untuk sampel berukuran nA = nB = 18.
Penyelesaian:
Dari distribusi sampling XbarA – XbarB, diketahui distribusi mendekati distribusi Normal dengan mean dan varian berikut.

Selanjutnya dengan menggunakan CLT diperoleh

maka P(XbarA – XbarB > 1) = … ? (dimana xbarA – xbarB = 1)

Selanjutnya probablilitas ini diselesaikan dengan bantuan Tabel Normal Standar.

maka

Probabilitas ini bernilai sangat kecil, maka peneliti dapat menduga bahwa mean Waktu Kering antara tipe Cat A dan B adalah sama.

Teorema untuk Distribusi t :

Sebagai Contoh, diberikan kasus perbandingan waktu transportasi bus A dan bus B untuk perjalanan antara dua kampus dari suatu Universitas. Diasumsikan waktu transportasi bus A dan bus B adalah sama. Pada bulan tertentu, dua bus tersebut digunakan untuk mengantar penumpang sebanyak 40 kali, sehingga diperoleh standar deviasi sampel bus A dan bus B masing-masing sebesar 6 menit dan 12 menit. Berapa probabilitas selisih dua mean waktu transportasi bus tersebut lebih dari 1? (Jika probabilitas ini melebihi 0,05 , maka peneliti akan menduga bahwa Waktu transportasi bus A dan bus B adalah berbeda)
Penyelesaian:
Dari distribusi sampling XbarA – XbarB, diketahui distribusi mendekati Normal dengan mean berikut.

Selanjutnya dengan menggunakan Teorema untuk Distribusi t diperoleh

maka P(XbarA – XbarB > 1) = … ? (dimana xbarA – xbarB = 1)

Selanjutnya probablilitas ini diselesaikan dengan bantuan Software Excel.

Langkah-langkah penyelesaian dengan Software Excel:

  1. Inputkan nilai t = 1.49 kedalam cell A2 dan nilai v = 78 kedalam cell B2.
  2. Inputkan juga suatu Formula kedalam cell C2, yaitu: =TDIST(A2,B2,1) .

maka diperoleh hasil

Probabilitas ini telah melebihi 0,05 , sehingga peneliti dapat menduga bahwa Waktu transportasi bus A dan bus B adalah berbeda.



REFERENSI

[1] Walpole, R.E., Myers, R.H., Myers, S.L., and Ye, K., (2012), Probability and Statistics for Engineers and Scientists, Ninth Edition, Boston: Pearson Education.
[2] Weiss, N.A., (2012), Elementary Statistics, 8th Edition, Boston: Addison-Wesley.


<--DOWNLOAD_FILE_DISTRIBUSI_SAMPLING-->


<--DOWNLOAD_TABEL:_DISTRIBUSI_NORMAL_STANDAR-->



Tulisan Sebelumnya ->Distribusi Variabel Acak Kontinu

Tulisan Berikutnya ->BELUM

0 komentar:

Poskan Komentar