Jenis-Jenis Error Pada Statistik

kita akan membahas tentang pengertian dan jenis error / kesalahan dalam statistik.

Apa itu Error/ kesalahan di Statisik?

Error (kesalahan statistik) menggambarkan perbedaan antara nilai yang diperoleh dari proses pengumpulan data dan nilai ‘benar’ untuk populasi . Semakin besar kesalahan, semakin kurang representatif data dari populasi.

Data dapat dipengaruhi oleh dua jenis error statistik: kesalahan sampling dan kesalahan non-sampling.


1. Sampling Error

Sampling error terjadi semata-mata sebagai akibat dari penggunaan sampel dari suatu populasi, daripada melakukan sensus (pencacahan lengkap) dari populasi tersebut. Ini mengacu pada perbedaan antara perkiraan populasi berdasarkan data dari sampel dan nilai ‘benar’ untuk populasi itu yang akan dihasilkan jika sensus diambil. Kesalahan pengambilan sampel tidak terjadi dalam sensus, karena nilai sensus didasarkan pada seluruh populasi.

Kesalahan pengambilan sampel dapat terjadi ketika:

  • proporsi karakteristik yang berbeda dalam sampel tidak sama dengan proporsi karakteristik untuk seluruh populasi (yaitu jika kita mengambil sampel laki-laki dan perempuan dan kita tahu bahwa 51% dari total populasi adalah perempuan dan 49% adalah laki-laki , maka kita harus bertujuan untuk memiliki proporsi yang sama dalam sampel kita);
  • sampel terlalu kecil untuk mewakili populasi secara akurat; dan
  • metode pengambilan sampel tidak acak.

Kesalahan pengambilan sampel dapat diukur dan dikendalikan dalam sampel acak di mana setiap unit memiliki peluang pemilihan, dan peluang itu dapat dihitung. Secara umum, meningkatkan ukuran sampel akan mengurangi kesalahan sampel.


2. non-sampling error?

Kesalahan non-sampling disebabkan oleh faktor-faktor selain yang terkait dengan pemilihan sampel. Hal ini mengacu pada adanya faktor apapun, baik sistemik atau acak, yang mengakibatkan nilai data tidak secara akurat mencerminkan nilai ‘benar’ untuk populasi.

Kesalahan non-sampling dapat terjadi pada setiap tahap sensus atau studi sampel, dan tidak mudah diidentifikasi atau diukur .

Kesalahan non-sampling dapat mencakup (tetapi tidak terbatas pada):

  • Cakupan error: ini terjadi ketika satu unit dalam sampel salah dikeluarkan atau dimasukkan, atau diduplikasi dalam sampel (misalnya pewawancara lapangan gagal mewawancarai rumah tangga yang dipilih atau beberapa orang dalam rumah tangga).
  • Kesalahan non-respons: ini mengacu pada kegagalan untuk mendapatkan respons dari beberapa unit karena ketidakhadiran, non-kontak, penolakan, atau alasan lain. Non-respons dapat berupa non-respons lengkap (yaitu tidak ada data yang diperoleh sama sekali dari unit yang dipilih) atau non-response parsial (yaitu jawaban atas beberapa pertanyaan belum disediakan oleh unit yang dipilih).
  • Kesalahan tanggapan: ini mengacu pada jenis kesalahan yang disebabkan oleh responden dengan sengaja atau tidak sengaja memberikan tanggapan yang tidak akurat. Hal ini terjadi ketika konsep, pertanyaan atau instruksi tidak dipahami dengan jelas oleh responden; ketika ada tingkat beban responden dan ingatan yang tinggi yang dibutuhkan; dan karena beberapa pertanyaan dapat menghasilkan kecenderungan untuk menjawab dengan cara yang diinginkan secara sosial (memberikan respons yang mereka rasa lebih dapat diterima daripada menjadi respons yang akurat).
  • Kesalahan pewawancara: ini terjadi ketika pewawancara salah mencatat informasi; tidak netral atau objektif; mempengaruhi responden untuk menjawab dengan cara tertentu; atau menganggap tanggapan berdasarkan penampilan atau karakteristik lainnya.
  • Kesalahan pemrosesan: ini mengacu pada kesalahan yang terjadi dalam proses pengumpulan data, entri data, pengkodean, pengeditan, dan keluaran.

Mengapa Error di Statistik itu penting?

Semakin besar kesalahan, semakin tidak dapat diandalkan hasil penelitian. Sumber data yang kredibel akan memiliki langkah-langkah selama proses pengumpulan data untuk meminimalkan jumlah kesalahan, dan juga akan transparan tentang ukuran kesalahan yang diharapkan sehingga pengguna dapat memutuskan apakah data ‘sesuai untuk tujuan’.

Contoh kata-kata pertanyaan yang dapat menyebabkan kesalahan non-sampling.

Ingatan kembali:
“Berapa kilometer perjalanan Anda pada bulan Juli tahun lalu?”

Pertanyaan yang diinginkan secara sosial:
“Apakah Anda secara teratur mendaur ulang kertas bekas dan plastik?”

Di bawah pelaporan:
“Berapa gelas alkohol yang Anda minum per minggu?”

Pelaporan berlebihan:
“Berapa banyak yang Anda menangkan dari perjudian minggu lalu?”

Pertanyaan utama:
“Apakah menurut Anda apa yang dilakukan pemerintah cukup untuk menghentikan peningkatan kejahatan kekerasan di jalan-jalan kita?”

Pertanyaan berlaras ganda:
“Apakah Anda senang dengan harga, dan layanan yang ditawarkan oleh, keanggotaan gym Anda?”