Pengacakan tidak menjamin datamu acak

 

Dalam banyak analisis dan pemodelan statistika, terutama statistika klasik, banyak disebutkan bahwa data atau error pada data harus bersifat acak. Tanpa adanya pemenuhan terhadap asumsi atau syarat tersebut, hasilnya jadi diragukan. Kemudian muncul pertanyaan, apakah data yang saya miliki ini memenuhi sifat tersebut. Acak tidak selalu dapat dipenuhi dengan mengambil sample secara acak. Proses pengumpulan dan karakteristik individu sumber data juga dapat mempengaruhi sifat keacakan data. Let’s look closer to this property.Pertama, acak dapat dikaitkan dengan tidak adanya unsur ketergantungan/kebebasan antar individu/objek/responden yang kita amati atau kita wawancarai. Contohnya begini. Pada suatu survey, misalnya, kita melakukan wawancara kepada beberapa orang siswa di sekolah. Metode wawancara yang dilakukan adalah mengumpulkan 6 orang siswa yang dipilih secara acak di suatu ruangan, kemudian ditanya pertanyaan yang sama. Masing-masing anak bergantian menjawab. Nah, jawaban anak pertama bisa saja mempengaruhi anak kedua. Itu kita sebut tidak bebas. Pada kasus ini, keacakan data diragukan meskipun responden dipilih secara acak.

Contoh yang lain adalah dalam pengumpulan data dengan percobaan. Andaikan kita menanam beberapa tanaman dalam suatu petak, kemudian setelah beberapa bulan berikutnya tanaman-tanaman tersebut diukur tingginya. Kalau kandungan hara di tanah petak tersebut terbatas, maka akan terjadi persaingan antar tanaman dalam mendapatkan hara untuk tumbuh. Besar kemungkinan, tanaman yang pertama tumbuh tinggi sedangkan tanaman yang kedua tidak karena tidak kebagian unsur hara lagi. Data tinggi tanaman-tanaman tersebut lagi-lagi tidak saling bebas, atau tidak acak.

Konsep yang kedua berhubungan dengan waktu pengumpulan data. Teman-teman di bagian quality control di pabrik kertas misalnya ingin melihat karakteristik mutu kertas yang dia produksi. Kalau datanya diperoleh dari kertas yang dihasilkan oleh batch bubur kertas yang sama, maka jelas tidak acak. Contoh yang lain lagi terkait dengan kelelahan petugas survei atau operator percobaan. Andaikan petugas survei berangkat pagi hari untuk menjalankan tugas dan ini hari pertama, besar kemungkinan proses mengumpulkan data pada responden-responden pertama berbeda dengan responden di sore hari. Di suatu percobaan, pada pengamatan kesekian di sore hari ada kemungkinan operator sudah lelah sehingga pengamatan dan pengukuran yang dia lakukan tidak seteliti pada pagi hari. Hal-hal seperti ini harus dengan baik diperhatikan untuk memastikan keacakan, kalau tidak maka data kita memiliki korelasi dengan waktu pengumpulan data sehingga bersifat auto-correlated.

Hal serupa juga dapat terjadi karena pengaruh jarak. Itu kenapa kemudian dikenal adanya data yang bersifat spatially auto-correlated.

 

Sekedar mengingatkan saja bahwa proses pengacakan di suatu survey atau percobaan bukan satu-satunya jaminan data bersifat acak. Manajemen pelaksanaan pengumpulan data juga memegang peranan yang besar dalam kasus ini.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s