Sabtu, 26 April 2014

Statistika Deskriptif

Pada penulisan Ketiga tentang Statistika Elementer ini, penulis akan memberikan bahasan mengenai Statistika Deskriptif kepada para pembaca untuk menambah wawasan penyajian statistika deskriptif pada data pengamatan. Ada beberapa peneliti yang masih menggunakan statistika deskriptif dengan kaidah yang tidak sesuai menurut teori statistika, seperti halnya menghitung Mean dari data kategori (berskala nominal/ordinal). Hal ini akan menyebabkan ketidaksesuaian karena data kategori tidak memiliki nilai Mean.


Deskripsi Data Pengamatan.

Pada Deskripsi Data dalam penulisan ini, diberikan Ukuran Tendensi Pusat, Ukuran Posisi, dan Ukuran Variasi. Ukuran numerik yang menggambarkan beberapa karakteristik dari Populasi adalah Parameter, sedangkan ukuran numerik yang menggambarkan beberapa karakteristik dari data pengamatan (Sampel) adalah Statistik yang mana tujuannya adalah untuk menduga atau mengestimasi Parameter[3]. Sebagai contoh, rata-rata penjualan yang diperoleh dari populasi keseluruhan adalah Parameter, sedangkan rata-rata penjualan dari suatu sampel yang representatif adalah Statistik. Statistik ini yang dijadikan sebagai penduga Parameter.


Deskripsi Data dengan Ukuran Tendensi Pusat.

Ukuran Tendensi Pusat atau Ukuran Pemusatan suatu data dapat diukur dengan Mean, Median, dan Modus. Berikut diberikan uraian tentang ukuran pemusatan ini:

  1. Mean adalah suatu nilai pusat (keseimbangan) untuk suatu variabel kontinu[4]. Mean Populasi disimbolkan dengan µ, sedangkan Mean Sampel disimbolkan dengan x-bar. Mean populasi dan Mean sampel masing-masing diberikan sebagai

    dengan N mewakili banyaknya data populasi dan n adalah banyaknya data sampel. Sebagai contoh, diberikan pengeluaran akhir tahun (dalam jutaan) dari sembilan cabang suatu perusahaan, yaitu: 30, 27, 40, 35, 25, 42, 37, 24, 32. Mean dari pengeluaran perusahaan adalah
  2. Median adalah nilai didalam suatu himpunan data terurut yang membagi data kedalam dua bagian dengan ukuran yang sama[4]. Nilai Median dapat ditemukan dengan rumusan.

    Untuk banyaknya data ganjil, diberikan contoh dari kasus sebelumnya dengan data yaitu: 30, 27, 40, 35, 25, 42, 37, 24, 32 ; kemudian data diurutkan dan diperoleh nilai Median.

    Nilai Median data adalah 32. Hasil ini juga dapat ditemukan dengan rumusan Median ketika diketahui banyaknya data n sebesar 9, sehingga Median MD = x(n+1)/2 = x(9+1)/2 = x5 = 32.
    Untuk banyaknya data genap, diberikan contoh dari kasus sebelumnya tanpa data terakhir yaitu: 30, 27, 40, 35, 25, 42, 37, 24 ; kemudian diperoleh data terurut beserta Median.

    Nilai Median data adalah (30+35)/2 = 32,5 . Nilai ini juga dapat diperoleh dengan rumusan Median ketika diketahui banyaknya data n = 8, sehingga Median MD = (xn/2 + xn/2+1)/2 = (x8/2 + x8/2+1)/2 = (x4 + x5)/2 = (30+35)/2 = 32,5 .
  3. Modus adalah nilai yang paling sering muncul dalam suatu himpunan data. Himpunan data yang memiliki hanya satu modus disebut data unimodal; kemudian himpunan data yang mempunyai dua modus disebut data bimodal; selanjutnya himpunan data yang memiliki lebih dari dua modus disebut data multimodal; sedangkan himpunan data yang tidak memiliki modus disebut sebagai data no mode[1]. Hal ini dapat ditunjukkan dari contoh kasus sebelumnya dengan data, yaitu: 30, 27, 40, 35, 25, 42, 37, 24, 32; sehingga terlihat tidak ada modus dalam himpunan data ini. Namun, misalkan setiap nilai dari himpunan data ini dibulatkan menuju bilangan kelipatan lima terdekat, maka himpunan data akan menjadi seperti ini: 30, 25, 40, 35, 25, 40, 35, 25, 30 ; sehingga diperoleh satu modus yaitu 25 karena nilai 25 paling sering muncul dalam himpunan data sebanyak 3 kali.

Bagaimana Ketentuan dari Penggunaan Mean, Median, dan Modus ?

Ukuran Pemusatan yang dapat digunakan untuk mewakili himpunan data diberikan dalam tabel berikut:

Suatu data pengamatan akan memiliki bentuk distribusi Normal yang Simetris ketika Mean, Median, dan Modus bernilai sama atau hampir sama; kemudian jika terdapat perbedaan yang jauh antara ketiga ukuran tersebut maka distribusi Normal yang terbentuk akan Miring Kanan (Right-Skewed) atau Miring Kiri (Left-Skewed); selanjutnya jika Mean dan Median bernilai sama atau hampir sama tanpa ada Modus maka data akan berdistribusi Uniform seperti pada gambar berikut ini[2].

Dari hasil contoh sebelumnya, diperoleh Mean sebesar 32,44 dan Median sebesar 32. Meskipun tidak diperoleh nilai Modus, terlihat nilai Mean hampir sama dengan nilai Median sehingga peneliti dapat menafsirkan bahwa data pengamatan memiliki bentuk distribusi Uniform.


Bagaimana Ukuran Tendensi Pusat pada Data Kelompok ?

Ukuran pemusatan untuk data numerik kelompok dihitung sesuai uraian berikut:

  1. Mean untuk data kelompok dihitung sebagai[2]

    dengan m adalah Banyaknya kelas dalam data kelompok, nilai fi adalah Frekuensi kelas ke-i, dan xi* adalah Titik Tengah kelas ke-i dengan xi* = (xL,i + xU,i)/2 , i = 1, 2, …, m. Nilai xL,i adalah Nilai Batas Bawah pada kelas ke-i, sedangkan Nilai xU,i adalah Nilai Batas Atas pada kelas ke-i. Sebagai contoh, diberikan contoh data yang diambil dari penulisan Kedua Statistika Elementer sebelumnya, yaitu.

    Nilai Mean dihitung dengan banyaknya kelas m sebesar 7, sehingga diperoleh

    Nilai ini menunjukkan bahwa nilai Mean berada pada kelas/interval ke-3.
  2. Median pada data Kelompok dirumuskan sebagai[5]

    dengan nilai LMD adalah batas bawah interval/kelas Median yang berada pada kelas yang mengandung frekuensi kumulatif sebesar separuh banyaknya data (n/2), fMD adalah frekuensi kelas Median, FMD adalah frekuensi kumulatif sebelum kelas Median, p adalah panjang kelas, dan n adalah banyaknya data sampel. Sebagai contoh, digunakan data dari contoh sebelumnya.

    Diketahui banyaknya data sampel n (Total Frekuensi) sebesar 50, sehingga kelas yang mengandung frekuensi kumulatif sebesar n/2 = 50/2 = 25 adalah kelas median. Hal ini dapat ditunjukkan bahwa kelas median jatuh pada kelas/interval ke-3. Oleh karena itu, batas bawah kelas median LMD = 109,5 , frekuensi kelas median fMD = 18, frekuensi kumulatif sebelum kelas Median FMD = 10, dan panjang kelas p = 104,5 – 99,5 = 5; sehingga nilai Median dihitung sebagai berikut.
  3. Modus pada data Kelompok dirumuskan sebagai[5]

    dengan nilai LMODUS adalah batas bawah interval/kelas modus yang memiliki frekuensi kelas (f) terbesar, d1 adalah selisih antara frekuensi kelas modus dan frekuensi kelas sebelumnya, d2 adalah selisih antara frekuensi kelas modus dan frekuensi kelas sesudahnya, dan p adalah panjang kelas. Identifikasi Modus dilakukan dengan cara mencari posisi kelas data yang memiliki frekuensi kelas terbesar. Sebagai contoh, digunakan contoh sebelumnya.

    Diketahui banyaknya data sampel n (Total Frekuensi) sebesar 50. Kelas yang memiliki frekuensi kelas terbesar jatuh pada kelas ke-3 dengan frekuensi sebesar 18, sehingga kelas modus adalah kelas/interval ke-3. Oleh karena itu, batas bawah kelas modus LMODUS = 109,5 , d1 = 18 – 8 = 10 , d2 = 18 – 13 = 5 , dan panjang kelas p = 104,5 – 99,5 = 5; sehingga nilai Modus dihitung sebagai berikut.

Pada contoh kasus ini, Mean, Median, dan Modus berada pada kelas/interval yang sama (kelas/interval ke-3), sehingga peneliti dapat menafsirkan bahwa data pengamatan memiliki bentuk distribusi Normal yang Simetris.


Deskripsi Data dengan Ukuran Posisi.

Ukuran Posisi atau Ukuran Lokasi dapat diberikan oleh Kuartil, Desil, dan Persentil. Berikut diberikan uraian tentang ukuran lokasi ini:

  1. Kuartil merupakan nilai yang membagi suatu distribusi frekuensi atau probabilitas kedalam empat bagian yang sama[4]. Empat bagian ini dipisahkan oleh Kuartil Pertama (Q1), Kuartil Kedua (Q2), dan Kuartil Ketiga (Q3).

    Sebagai contoh pertama, nilai Q1, Q2, dan Q3 untuk banyaknya data ganjil, yaitu : 30, 27, 40, 35, 25, 42, 37, 24, 32 adalah.

    Nilai Q1 = (25 + 27)/2 = 26 ; Q2 = Median = 32 ; dan Q3 = (37 + 40)/2 = 38,5 .
    Sebagai contoh kedua, nilai Q1, Q2, dan Q3 untuk banyaknya data genap, yaitu: 30, 27, 40, 35, 25, 42, 37, 24 adalah.

    Nilai Q1 = 25 ; Q2 = Median = (30 + 35)/2 = 32,5 ; dan Q3 = 40 .
  2. Desil merupakan nilai yang membagi suatu distribusi frekuensi atau probabilitas kedalam 10 bagian yang sama.

    Sebagai contoh, akan dicari nilai data (skor) pada desil ke-4. Dari himpunan data terurut 10, 15, 20, 30, 40, 50, 60, 75 ; dicari letak posisi urutan ke- b = (n . Desil)/10 = (8 . 4)/10 = 3,2 ≈ 3 . Nilai ini menunjukkan bahwa nilai data (skor) yang berada di posisi urutan ke-3 adalah 20, sehingga desil ke-4 atau D4 adalah 20.
  3. Persentil merupakan ukuran posisi membagi himpunan data kedalam 100 bagian yang sama.

    Sebagai contoh, akan dicari nilai data (skor) pada persentil ke-35. Dari himpunan data terurut 10, 15, 20, 30, 40, 50, 60, 75, 90, 100 ; dicari letak posisi urutan ke- c = (n . Persentil)/100 = (10 . 35)/100 = 3,5 . Nilai ini menunjukkan bahwa nilai data (skor) yang berada diantara urutan ke-3 dan ke-4 adalah (20 + 30)/2 = 25, sehingga persentil ke-35 atau P35 adalah 25. Sebagai catatan, Persentil ke-25 (P25) sama dengan Kuartil 1 (Q1); Persentil ke-50 (P50) sama dengan Kuartil Kedua (Q2) atau Median; dan Persentil ke-75 (P75) sama dengan Kuartil Ketiga (Q3)[1].

Bagaimana Ukuran Posisi pada Data Kelompok ?

Ukuran posisi untuk data numerik kelompok dihitung menurut uraian berikut:

  1. Kuartil ke-i dengan i = 1, 2, 3 untuk data kelompok dirumuskan[5] sebagai

    dengan nilai LQi adalah batas bawah interval/kelas Qi yang berada pada kelas yang mengandung frekuensi kumulatif sebesar (i . n)/4 dari data kelompok, fQi adalah frekuensi pada kelas Qi, FQi adalah frekuensi kumulatif sebelum kelas Qi, p adalah panjang kelas, dan n adalah banyaknya data sampel. Sebagai contoh, digunakan contoh sebelumnya.

    Untuk menghitung Kuartil Pertama (Q1), diketahui banyaknya data sampel n (Total Frekuensi) sebesar 50, sehingga kelas yang mengandung frekuensi kumulatif sebesar (i . n)/4 = (1 . 50)/4 = 12,5 ≈ 13 adalah kelas Kuartil Pertama. Hal ini dapat diberikan bahwa kelas Kuartil Pertama jatuh pada kelas/interval ke-3. Oleh karena itu, batas bawah kelas Kuartil Pertama LQ1 = 109,5 , frekuensi kelas Kuartil Pertama fQ1= 18, frekuensi kumulatif sebelum kelas Kuartil Pertama FQ1 = 10, dan panjang kelas p = 104,5 – 99,5 = 5; sehingga nilai Kuartil Pertama (Q1) dihitung sebagai berikut.

    Kuartil Kedua (Q2) sama dengan Median, sehingga

    Untuk mendapatkan Kuartil Ketiga (Q3), diketahui banyaknya data sampel n (Total Frekuensi) sebesar 50, sehingga kelas yang mengandung frekuensi kumulatif sebesar (i . n)/4 = (3 . 50)/4 = 37,5 ≈ 38 adalah kelas Kuartil Ketiga. Hal ini dapat diberikan bahwa kelas Kuartil Ketiga jatuh pada kelas/interval ke-4. Oleh karena itu, batas bawah kelas Kuartil Ketiga LQ3 = 114,5 , frekuensi kelas Kuartil Ketiga fQ3 = 13, frekuensi kumulatif sebelum kelas Kuartil Ketiga FQ3 = 28, dan panjang kelas p = 104,5 – 99,5 = 5; sehingga nilai Kuartil Ketiga (Q3) dihitung sebagai berikut.

  2. Desil ke-i dengan i = 1, 2, …, 10 untuk data kelompok dirumuskan[5] sebagai

    dengan nilai LDi adalah batas bawah interval/kelas Di yang berada pada kelas yang mengandung frekuensi kumulatif sebesar (i . n)/10 dari data kelompok, fDi adalah frekuensi pada kelas Di, dan FDi adalah frekuensi kumulatif sebelum kelas Di.
  3. Persentil ke-i dengan i = 1, 2, …, 100 untuk data kelompok dirumuskan[5] sebagai

    dengan nilai LPi adalah batas bawah interval/kelas Pi yang berada pada kelas yang mengandung frekuensi kumulatif sebesar (i . n)/100 dari data kelompok, fPi adalah frekuensi pada kelas Pi, dan FPi adalah frekuensi kumulatif sebelum kelas Pi.

Deskripsi Data dengan Ukuran Variasi.

Ukuran Variasi atau Ukuran Variabilitas suatu data dapat diwakili oleh Range, Interquartile Range, Varian, Standar Deviasi, dan Koefisien Variasi. Berikut diberikan uraian tentang ukuran variabilitas ini:

  1. Range merupakan ukuran variabilitas yang paling sederhana dari ukuran variabilitas lainnya. Range diberikan dengan rumusan.

    Nilai Range ini berguna dengan baik ketika data sampel berukuran kecil. Sebagai contoh, diberikan suatu pengujian dua merk cat tembok A dan B untuk mengetahui berapa lama setiap cat tembok akan bertahan sebelum luntur. Dilakukan pengujian 6 kaleng untuk setiap merk cat tembok. Diperoleh data pengamatan (dalam bulanan) sebagai berikut:

    Cat tembok merk A memiliki Range R = 60 – 10 = 50 bulan, sedangkan merk B mempunyai Range R = 45 – 25 = 20. Hal ini yang membuat yakin peneliti bahwa cat tembok merk A memiliki ukuran variabilitas yang tidak lebih baik daripada cat tembok merk B.
  2. Interquartile Range (IQR) yang didefinisikan sebagai perbedaan antara Q1 dan Q3. Nilai IQR dapat digunakan sebagai ukuran kasar dari variabilitas, yaitu IQR merupakan range dari pertengahan 50% himpunan data[1] yang mana diberikan rumusannya sebagai berikut.
  3. Varian merupakan rata-rata dari kuadrat jarak setiap nilai data dari nilai Mean(x-bar)[1]. Varian Populasi disimbolkan dengan σ2 sedangkan Varian Sampel disimbolkan oleh s2. Varian populasi dan Varian sampel masing-masing dirumuskan sebagai:

    dengan N mewakili banyaknya data populasi dan n adalah banyaknya data sampel. Hal yang mungkin menimbulkan pertanyaan mengapa pembagi dalam varian sampel adalah n – 1. Jawaban umum yang biasanya diberikan adalah varian sampel dapat bernilai tidak bias (nilai varian sampel mendekati varian populasi) ketika menggunakan pembagi n – 1. Dari pembagi ini, sebenarnya diperoleh jawaban tambahan bahwa banyaknya data sampel yang diambil seharusnya tidak satu karena data yang memiliki satu nilai tidak memiliki varian (keragaman). Hal ini mengingat bahwa rumusan varian sampel berlaku untuk n – 1 ≠ 0 atau n ≠ 1. Itu sebabnya pembagi dalam varian sampel adalah n – 1 bukannya n, sedangkan pembagi dalam varian populasi adalah N karena banyaknya data populasi tidak mungkin satu.
  4. Standar Deviasi merupakan akar kuadrat dari varian. Standar Deviasi juga digunakan untuk mengukur risiko, yaitu besar penyimpangan antara nilai harapan (Mean) dan nilai aktual. Standar Deviasi Populasi dan Standar Deviasi Sampel masing-masing dihitung dengan rumusan

    dengan N mewakili banyaknya data populasi dan n adalah banyaknya data sampel.
  5. Koefisien Variasi adalah Standar Deviasi yang dibagi oleh Mean. Hasil ini diekspresikan dalam suatu persentase. Koefisien Variasi Populasi dan Koefisien Variasi Sampel masing-masing dihitung dengan rumusan[1]

Bagaimana Ukuran Variasi terutama Varian pada Data Kelompok ?

Ukuran variasi terutama Varian untuk data numerik kelompok dihitung dengan rumusan[2]

dengan m adalah Banyaknya kelas dalam data kelompok, nilai fi adalah Frekuensi kelas ke-i, dan xi* adalah Titik Tengah kelas ke-i dengan xi* = (xL,i + xU,i)/2 , i = 1, 2, …, m. Nilai xL,i adalah Nilai Batas Bawah pada kelas ke-i, sedangkan Nilai xU,i adalah Nilai Batas Atas pada kelas ke-i. Sebagai contoh, diberikan contoh sebelumnya pada bahasan Mean untuk data Kelompok diperoleh Mean (x-bar) sebesar 114,2 .

Nilai Varian dihitung dengan banyaknya kelas m sebesar 7, sehingga diperoleh


REFERENSI

[1] Bluman, A.G., (2012), Elementary Statistics: A Step By Step Approach, Eighth Edition, New York: McGraw-Hill.
[2] Larson, R. dan Farber, B., (2012), Elementary Statistics: Picturing The World, Fifth Edition, Boston: Pearson Education.
[3] Triola, M.F., (2012), Elementary Statistics: Technology Update, 11th Edition, Boston: Addison-Wesley.
[4] Everitt, B.S., dan Skrondal, A., (2010), The Cambridge Dictionary of Statistics, Fourth Edition, New York: Cambridge University Press.
[5] Sharma, A.K., (2005), Text Book of Elementary Statistics, Delhi: Arora Offset Press.


<--DOWNLOAD_FILE_STATISTIKA_DESKRIPTIF-->



Tulisan Sebelumnya ->Penyajian Data Statistik

Tulisan Berikutnya ->Pengantar Probabilitas

0 komentar:

Poskan Komentar