Belajar F-Test dan t-Test Menggunakan Python
Uji -F digunakan untuk menguji apakah dua varian populasi sama. Hipotesis nol dan alternatif untuk pengujian tersebut adalah sebagai berikut:
H 0 : σ 1^2 = σ 2^2 (varians populasi sama)
H 1 : σ 1^2 ≠ σ 2^2 (varians populasi tidak sama)
Uji-F Menggunakan Python
Misalkan kita memiliki data yang diperoleh dari random value generator dengan fungsi sebagai berikut:
import scipy.stats as stats
x1=stats.norm.rvs(0,5,100)
x2=stats.norm.rvs(1,4,100)
x3=stats.skewnorm.rvs(5,size=100)
Sepuluh data pertama dari nilai x1, x2 dan x3 adalah sebagaimana tabel berikut:
Kurva distribusi untuk 100 data dengan sebaran seperti data pada tabel di atas adalah sebagai berikut:
Kita dapat menggunakan fungsi berikut untuk melakukan uji-F untuk menentukan apakah ketiga populasi sampel ini berasal memiliki varian yang sama:
Uji F untuk data x1 vs x2 diperoleh nilai F statistik di bawah nilai F kritis, sehingga disimpulkan tidak ada perbedaan yang signifikan antara data x1 dan x2
F-statistic = 1.1227655322746735, F-kritis = 1.486233767619293
P-value untuk x1 dan x2 adalah
0.5499896393286035
Karena p-value lebih dari 0,05 bisa dikatakan tidak ada perbedaan signifikan dari varians x1 dan x2.
Uji F untuk data x1 vs x3 diperoleh nilai F statistik lebih besar daripada nilai F kritis, sehingga disimpulkan ada perbedaan yang signifikan antara data x1 dan x3
F-statistic = 59.887079034750364, F-kritis = 1.486233767619293
Dengan p-value sama dengan nilai p-value x1 dan x2 karena ddfn dan ddfd-nya sama.
Karena p-value lebih dari 0,05 bisa dikatakan tidak ada perbedaan signifikan dari varians x1 dan x2.
Uji F untuk data x2 vs x3 diperoleh nilai F statistik lebih besar daripada nilai F kritis, sehingga disimpulkan ada perbedaan yang signifikan antara data x2 dan x3
F-statistic = 53.33890052130634, F-kritis = 1.486233767619293
Dengan p-value sama dengan nilai p-value x1 dan x2 karena ddfn dan ddfd-nya sama.
Uji statistik F dihitung sebagai
- Nilai p sesuai dengan 1 — cdf dari distribusi F dengan derajat kebebasan pembilang = n1 -1 dan derajat kebebasan penyebut = n2 -1.
- Fungsi ini hanya berfungsi jika varian sampel pertama lebih besar dari varian sampel kedua. Jadi, tentukan dua sampel sedemikian rupa sehingga mereka bekerja dengan fungsinya.
Kapan Menggunakan Uji-F
Uji-F biasanya digunakan untuk menjawab salah satu pertanyaan berikut:
1. Apakah dua sampel berasal dari populasi dengan varian yang sama?
2. Apakah perlakuan atau proses baru mengurangi variabilitas dari beberapa perlakuan atau proses saat ini?
Uji-t Menggunakan Python
Setiap kali kita melakukan uji-t, akan didapatkan nilai t-statistik uji sebagai hasilnya. Untuk menentukan apakah hasil t-test yang signifikan secara statistik, nilai statistik uji-t dibandingkan dengan nilai kritis T . Jika nilai absolut statistik pengujian lebih besar dari nilai kritis T, maka hasil pengujian signifikan secara statistik.
Nilai kritis T dapat diketahui dengan menggunakan tabel distribusi t atau dengan menggunakan software statistik.
Untuk menemukan nilai kritis T, kita perlu menentukan:
- Tingkat signifikansi (biasanya: 0,01, 0,05, dan 0,10)
- Derajat kebebasan
Dengan menggunakan kedua nilai ini, dapat ditentukan nilai kritis T untuk dibandingkan dengan statistik uji.
Uji t untuk variabel x1 dan x2 adalah sebagai berikut:
Ttest_indResult(statistic=0.40662443080784, pvalue=0.6847230310717759)
Dengan p-value lebih besar daripada 0,05 maka tidak ada perbedaan signifikan nilai rata-rata x1 dan x2. Hal ini diperkuat dengan perbandingan nilai t-statistik dan nilai t-kritis, dimana t-statistik lebih kecil daripada nilai t-kritis.
T-kritis untuk data dengan dof 99 adalah
1.9842169515086827
Uji t dengan unequal varians untuk x1 terhadap x3 memberikan nilai t statistik lebih besar daripada t-kritis. Diperkuat dengan nilai p-value di bawah 0,05, maka ada perbedaan signifikan antara nilai rata-rata x1 dengan x3.
Ttest_indResult(statistic=2.466316569639681, pvalue=0.015330620795696942)
Hasil untuk x2 dan x3 sama dengan penjelasan untuk x1 dengan x3.
Ttest_indResult(statistic=2.4630782836137786, pvalue=0.01462877690011489)
Cara perhitungan untuk uji F dan t di atas dijelaskan dalam video berikut: