Error — Galat pada hasil pengukuran

Suprapto van Plaosan
4 min readApr 25, 2021

--

Error/Galat/Residu

Error/Galat statistik adalah perbedaan antara nilai terukur dan nilai sebenarnya dari data yang dikumpulkan. Jika nilai kesalahannya signifikan, maka data tersebut akan dianggap kurang dapat diandalkan. Oleh karena itu, perlu diingat bahwa data tersebut harus memiliki nilai error yang minimal. Sehingga datanya bisa dianggap lebih andal.

Galat/Error selalu ada dalam pengukuran . Error bukanlah “kesalahan”, error adalah bagian dari proses pengukuran. Dalam penelitian, kesalahan pengukuran disebut kesalahan eksperimental atau kesalahan observasi.

Ada dua jenis error pada hasil pengukuran: kesalahan acak dan kesalahan sistematis .

  • Kesalahan acak bervariasi secara tidak teratur dari satu pengukuran ke pengukuran lainnya, sedangkan
  • Kesalahan sistematis memiliki nilai atau proporsi yang sama untuk setiap pengukuran.

Kesalahan acak tidak dapat dihindari, tetapi mengelompok di sekitar nilai sebenarnya.

Kesalahan sistematik seringkali dapat dihindari dengan mengkalibrasi peralatan, tetapi jika dibiarkan tidak dikoreksi, dapat menyebabkan pengukuran jauh dari nilai yang sebenarnya.

Sebagai contoh, empat mahasiswa (A — D) masing-masing melakukan analisis di mana tepat 10,00 ml larutan natrium hidroksida 0,1 M tepat dititrasi dengan asam klorida 0,1 M. Setiap mahasiswa melakukan lima replikasi, dengan hasil yang ditunjukkan pada Tabel 1.1 dalam Buku : Statistics and Chemometrics for Analytical Chemistry, Miller J.C. and Miller J.C.

Sebaran data dapat digambarkan sebagai berikut:

Dari nilai rata-rata hasil pengukuran ke-empat mahasiswa tersebut dapat dilihat bahwa mahasiswa B dan D mendapatkan data yang mendekati nilai sebenarnya, sebagaimana gambar di bawah ini.

Dengan kata lain, Mahasiswa B dan D mendapatkan hasil titrasi yang lebih akurat daripada Mahasiswa A dan C.

Akurasi:
Menurut ISO 5725–1, istilah umum “akurasi” digunakan untuk menggambarkan kedekatan suatu pengukuran dengan nilai sebenarnya.

Namun, bila dilihat sebaran datanya, yang dapat dilihat dari nilai simpangan bakunya. Mahasiswa A dan D mempunyai hasil dengan simpangan baku yang kecil. Dengan kata lain, Mahasiswa A dan D mempunyai hasil pengukuran yang lebih presisi.

Dalam hal ini Trueness’ adalah kedekatan nilai rata-rata hasil pengukuran dengan nilai sebenarnya dan, presisi adalah kedekatan kesepakatan di antara sekumpulan hasil.

Untuk mempelajari jenis Galat yang dihasilkan, apakah acak atau sistematis. Inferensi dengan data yang lebih besar dilakukan. Bila nilai galat atau residual pengukuran mempunyai distribusi normal dengan nilai rata-rata sama dengan nol, dikatakan jenis galat yang didapat adalah acak. Bila nilai rata-rata distribusinya menyimpang dari nol, berkemungkinan galat yang didapatkan bersifat sistematis.

Dari kurva distribusi error Mahasiswa A mengindikasikan adanya error sistematis. Sementara error Mahasiswa D kemungkinan besar bersifat acak.

Error pada Analisis Regresi Linier

Berikut gambaran penentuan error dari 20 data dengan nilai x dari 0 sd 10 dan nilai y = 2+0.5*x+np.random.normal(x,2.5,x.shape).

Prediksi nilai y menggunakan model linier dengan independen variabel x dan y, menghasilkan garis linier sebagaimana gambar di bawah ini.

Selisih antara nilai y dengan nilai y_prediksi (x — x_prediksi) disebut sebagai error atau residu.

SSE (Sum of Squared Error)

Menurut wikipedia, jumlah perkiraan kuadrat kesalahan (SSE), dikenal juga sebagai jumlah sisa kuadrat (RSS) atau jumlah kuadrat residual (SSR) (jumlah kuadrat dari selisih nilai sebenarnya dengan nilai prediksi = Σ(x-x_pred)². SSE merupakan ukuran perbedaan antara data dan model estimasi, seperti pada model regresi linier. RSS kecil menunjukkan model yang sangat cocok dengan data. SSE juga digunakan sebagai kriteria optimalisasi dalam pemilihan parameter dan pemilihan model. Gambar di bawah menunjukkan nilai kuadrat dari residu atau error yang didapat. Jumlah dari kuadrat error (SSE) nya adalah 118.6026.

Mean Squared Error (MSE)

Dalam statistik, mean squared error (MSE) atau mean squared deviation (MSD) dari suatu estimator/variabel independen, mengukur rata-rata kuadrat kesalahan — yaitu, perbedaan kuadrat rata-rata antara perkiraan nilai dan nilai sebenarnya (SSE/n). MSE adalah fungsi risiko, sesuai dengan nilai yang diharapkan dari kerugian kesalahan kuadrat. Fakta bahwa MSE hampir selalu positif (dan bukan nol) adalah karena keacakan atau karena estimator tidak memperhitungkan informasi yang dapat menghasilkan perkiraan yang lebih akurat.

MSE adalah ukuran kualitas estimator — selalu non-negatif, dan nilai yang mendekati nol lebih baik.

MSE = SSE/n =118.60261/20 = 5.9301

Root Mean Square Error (RMSE)

RMSE hampir mirip dengan deviasi standar, yaitu, merupakan akar kuadrat dari MSE. Root-mean-square error disebut juga root-mean-square deviation (RMSE atau RMSD). RMSE merupakan akar kuadrat dari varians, yang dikenal sebagai standar error.

Deviasi standar digunakan untuk mengukur penyebaran data di sekitar mean, sedangkan RMSE digunakan untuk mengukur jarak antara nilai acuan dan prediksi dari nilai-nilai tersebut. RMSE umumnya digunakan untuk mengukur kesalahan prediksi, yaitu seberapa besar perbedaan prediksi yang dibuat dengan data yang diprediksi.

RMSE = sqrt(MSE) = sqrt(5.93013) = 2.4352

--

--