Artikel
2012-02-13 13:51:28 author by admin
Seleksi Data Hasil Analisis
Oleh : Trisna Yuliana & Julia Kantasubrata
PENDAHULUAN
Dari suatu kumpulan data , baik dari data hasil analisis maupun data uji profisiensi seringkali dijumpai satu atau lebih data yang menyimpang terhadap data-data lainnya. Di dalam hal ini, sebelum dilakukan pengolahan data, sebaiknya diputuskan terlebih dahulu apakah data yang menyimpang tadi harus dibuang atau dapat dipertahankan.
Ketika Berhadapan dengan suatu kumpulan data yang mempunyai jumlah data (n) cukup besar, dibuang atau tidaknya salah satu data tidak akan memberikan pengaruh yang cukup berarti. Mengapa? Karena pengaruh dari hanya satu data saja, akan memberikan efek penyimpangan yang besar terhadap harga rata kumpulan data dengan n relatif besar.
Gambar 1. Data Ekstrim/Outlier
Sebaiknya, berhadapan dengan suatu kumpulan data yang mempunyai jumlah data relatif sedikit (n < 6), akan menimbulkan suatu permasalahan. Bukan saja data yang menyimpang tadi dapat memberikan pengaruh yang cukup besar terhadap harga rata-rata, tetapi juga tidak terdapat jumlah data yang cukup untuk melakukan perhitungan statistika guna menganalisis data yang diragukan tadi (Julia, K., 1991)
Didalam kimia analitik sangat jarang kita temukan data pengulangan dalam jumlah yang cukup besar. Seringkali ditemui 1 set kumpulan data hanya terdiri atas beberapa data saja. Oleh karena itu apabila terdapat data yang menyimpang maka terhadap data tersebut harus dilakukan seleksi data atau uji outliner.
Umumnya, seleksi data dilakukan dengan mengukur jarak relatif antara nilai yang dicurigai mempunyai potensi yang menyimpang terhadap nilai rata-rata kumpulan data. Dari hasil pengukuran yang diperoleh dapat dinilai apakah nilai ekstrim tersebut perlu dibuang atau dapat digabung dengan data yang lain untuk kemudian diolah lebih lanjut.
Terdapat berbagai cara seleksi data, yaitu cara Dixon dan cara Grubbs. Cara Dixon berlaku untuk menyeleksi nilai ekstrim tunggal (Gambar 1c atau 1b) dan seringkali keberadaan nilai ekstrim didalam satu kelompok data lebih dari Satu (Gambar 1c, 1d dan 1e).
Untuk kondisi seperti ini dapat diberlakukan seleksi data dengan Dixon secara berulang. Akan tetapi apabila posisi data ekstrimnya berpasanagn yaitu terdapat dua data ekstrim pada satu posisi, baik pada posisi data terendah (Gambar 1d) maupun tertinggi (Gambar 1e) dan nilai diantara kedua data ekstrim tidak terlampau jauh berbeda maka dengan cara Dixon kedua data tidak akan dapat dibuang karena keduanya saling menutupi (masking). Cara Grubbs mempunyai keunggulan dibandingkan cara Dixon karena dengan cara Grubbs dapat membunag sekaligus data ekstrim yang berpasangan. Dalam hal ini efek masking tidak berpengaruh.
Didalam makalah ini akan dibahas dengan rinci bagaimana cara menseleksidata denagn cara Dixon dan Grubbs terhadap satu kelompok data yang sama.
Seleksi Data dengan Uji Dixon
Pada uji Dixon, mula-mula data disusun mulai dari yang terendah hingga tertinggi. Tergantung pada jumlah datanya maka pada uji Dixon kumpulan data dapat dikelompokkan menjadi 3. Kelompok pertama untuk jumlah data 3 hingga 7; kelompok kedua dengan jumlah data 8 hingga 12; kelompok terakhir ditujukan untuk jumlah data 13 sampai 40. Masing-masing kelompok terbagi lagi atas 2 bagian. Bagian pertama untuk data terendah dan bagian kedua untuk data tertinggi. Rumus Dixon dapat dilihat pada Tabel 1.
Tabel 1. Nilai Kritis untuk Uji Dixon
Apabila Berdasarkan rumus pada Tabel I diperoleh nilai D yang lebih besar dari nilai kritis yang tercantum pada kolom ke-4 dari tabel tersebut, maka data terendah/tertinggi perlu dibuang. Sebaliknya jika D hasil perhitungan lebih kecil dari D kritisnya maka data ekstrim tersebut dapat digabung dengan data yang lain untuk kemudian diolah lebih lanjut.
Sebagai contoh perhitungan diandaikan kita mempunyai suatu kumpulan data dari penentuan kadar karbohidrat dalam produk makanan seperti tampak pada Tabel 2. Data tersebut sudah disusun mulai dari data terendah hingga tertinggi.
Tabel 2.
Data hasil penentuan karbohidrat dalam produk makanan
Terlihat dari kumpulan data diatas, data 1 dan data 2 cukup berbeda dari data lainnya.
Karena jumlah data (n) = 12; maka digunakan rumus :
- a. Untuk data terendah
Dari tabel 1. Untuk jumlah data 12 nilai D kritis adalah 0.479. Karena D hitung < D kritis maka data ke-1 tidak perlu dibuang
- b. Untuk data tertinggi
Dari Tabel 2 untuk jumlah data 12 nilai D kritis adalah 0.479. Karena D hitung lebih kecil dari D kritis maka untuk data ke-12 pun tidak dibuang.
Apabila dilihat, sebernarnya nilai data 1 dan data 2 cukup berbeda dari data lainnya. Akan tetapi dari hasil perhitungan uji Dixon, data ke-1 sekalipun tidak terbuang, apalagi data yang ke-2. Disini terlihat bahwa data ke-1 dilindungi oleh data ke-2 (masking). Agar dapat menyeleksi kedua data ekstrim tadi dengan lebih cermat diperlukan cara seleksi data yang lain yaitu uji Grubbs.
Seleksi Data dengan Uji Grubbs
Pada uji grubbs terdapat 3 macam rumus. Rumus yang pertama (G1) berlaku jika terdapat hanya satu data ekstrim seperti terlihat pada gambar 1a atau 1b. Rumus kedua (G2) diaplikasikan apabila terdapat dua data ekstrim yaitu 1 data ekstrim pada posisi terendah dan 1 data ekstrim pada posisi tertinggi seperti gambar 1c. Rumus yang terakhir (G3) diterapkan ketika terdapat 2 buah data ekstrim yang letaknya berdekatan satu sama lain (berpasangan) seperti yang terlihat pada gambar 1d atau 1e. Rumus G1, G2 dan G3 selengkapnya dapat dilihat di bawah ini.
Dimana : X = rata-rata; xi = data ekstrim; | | = tanda absolut (untuk menghilangkan tanda (+) atau (-)); xn = data tertinggi; x1 = data terendah; n = jumlah data; sn-2 = simpangan baku tanpa memperhitungkan pasangan data ekstrim; dan s = simpangan baku.
Seperti halnya pada uji Dixon, sebelum data diolah, mula-mula data harus disusun mulai dari yang terendah hingga tertinggi. Selanjutnya dilihat bagaimana posisi data ekstrim berada.
Data pada Tabel 2 memiliki 2 data menyimpang yang berpasangan. Untuk kelompok data jenis ini harus diterapkan rumus G3 untuk menyelesaikannya.
Dari tabel 3 pada kolom G3 untuk jumlah data 12 dan tingkat kepercayaan 95 % nilai kritisnya adalah 0.7004. Karena G3 hitung lebih besar dari tabel maka data ke-1 dan data ke-2 harus dibuang. Sisa data kemudian dapat diolah lebih lanjut.
Tabel 3. Nilai Kritis untuk Uji Grubbs
Bagaimana contoh penerapan rumus G1 dan G2 ? Rumus G1 dapat diterapkan untuk contoh kumpulan data seperti terlihat pada Tabel 4 sedangkan rumus G2 diaplikasikan pada contoh kumpulan data seperti pada Tabel 5.
PENUTUP
Dari kedua cara seleksi data yang diuraikan diatas, terlihat bahwa cara Grubbs relatif lebih selektif dibandingkan cara Dixon, terutama pada kasus dimana terdapat dua data ekstrim yang berpasangan dan jarak data diantara keduanya tidak terlalu besar. Selain itu dengan cara Grubbs dimungkinkan untuk membuang dua data sekaligus. Hal ini tidak dimungkinkan pada cara Dixon karena apabila terdapat lebih dari 1 data ekstrim maka dengan uji Dixon data-data tersebut dibuang satu persatu.
DAFTAR PUSTAKA
- Farrant, Tj., Practical Statistics for The Analytical Scientist A Bench Guide, The Royal Society of Chemistry.
- Kantasubrata, J., 1991, Kriteria Membuang Data, WKA No 9 Th VI. Puslitbang Kimia Terapan – LIPI.
- Shaun Burke, Statistic & Data Analysis : Missing Value, Outliners, Robust Statistics & Non-parametric Methods, LC.GC Europe Online Supplement