Contoh Soal Pembahasan Koefisien Determinasi
Koefisien determinasi (R²) adalah salah satu parameter penting dalam analisis regresi yang menunjukkan seberapa baik model regresi menjelaskan variabilitas data yang sebenarnya. Dalam artikel ini, kita akan menjelaskan konsep koefisien determinasi melalui contoh soal dan pembahasannya secara rinci.
Konsep Dasar Koefisien Determinasi
Koefisien determinasi atau \( R^2 \) diukur dalam skala 0 hingga 1, di mana:
– \( R^2 = 0 \) menunjukkan bahwa model regresi tidak mampu menjelaskan variabilitas data sama sekali.
– \( R^2 = 1 \) menunjukkan bahwa model regresi mampu menjelaskan seluruh variabilitas data sempurna.
Rumus dasar untuk menghitung koefisien determinasi adalah:
\[ R^2 = 1 – \frac{SSR}{SST} \]
Di mana:
– SSR (Sum of Squared Residuals) adalah jumlah kuadrat dari selisih antara nilai yang diprediksi oleh model dan nilai sebenarnya.
– SST (Total Sum of Squares) adalah total dari jumlah kuadrat selisih antara nilai sebenarnya dengan rata-rata nilai sebenarnya.
Contoh Soal
Mari kita bahas sebuah contoh soal untuk memahami perhitungan koefisien determinasi secara lebih mendalam.
Contoh Soal:
Misalkan kita memiliki data mengenai jumlah jam belajar (X) dan nilai ujian (Y) dari 10 siswa:
| Siswa | Jam Belajar (X) | Nilai Ujian (Y) |
|——-|—————–|—————–|
| 1 | 2 | 58 |
| 2 | 3 | 64 |
| 3 | 4 | 70 |
| 4 | 5 | 85 |
| 5 | 2 | 57 |
| 6 | 3 | 68 |
| 7 | 4 | 72 |
| 8 | 5 | 90 |
| 9 | 3 | 62 |
| 10 | 4 | 78 |
Kita akan membuat sebuah model regresi linier sederhana di mana nilai ujian (Y) diprediksi berdasarkan jam belajar (X).
Pembahasan
1. Membangun Model Regresi Linier Sederhana
Model regresi linier sederhana memiliki bentuk:
\[ Y = a + bX \]
Di mana:
– \( Y \) adalah nilai ujian yang diprediksi.
– \( X \) adalah jumlah jam belajar.
– \( a \) adalah intercept (titik potong pada sumbu Y ketika X = 0).
– \( b \) adalah slope (kemiringan garis regresi).
Untuk menghitung parameter \( a \) dan \( b \), kita gunakan rumus berikut:
\[ b = \frac{n(\sum{XY}) – (\sum{X})(\sum{Y})}{n(\sum{X^2}) – (\sum{X})^2} \]
\[ a = \frac{\sum{Y} – b(\sum{X})}{n} \]
Di mana \( n \) adalah jumlah data (dalam hal ini n = 10).
Dari tabel kita dapat menghitung:
– \(\sum{X} = 36\)
– \(\sum{Y} = 704\)
– \(\sum{X^2} = 140\)
– \(\sum{Y^2} = 50428\)
– \(\sum{XY} = 2576\)
Mari kita hitung b terlebih dahulu:
\[ b = \frac{10(2576) – (36)(704)}{10(140) – (36)^2} \]
\[ b = \frac{25760 – 25344}{1400 – 1296} \]
\[ b = \frac{416}{104} \]
\[ b = 4 \]
Kemudian, kita hitung a:
\[ a = \frac{704 – 4(36)}{10} \]
\[ a = \frac{704 – 144}{10} \]
\[ a = \frac{560}{10} \]
\[ a = 56 \]
Jadi, model regresi linier yang kita dapatkan adalah:
\[ Y = 56 + 4X \]
2. Menghitung Nilai yang Diprediksi (Y’)
Selanjutnya, kita hitung nilai yang diprediksi \( Y’ \) untuk setiap \( X \):
| Siswa | Jam Belajar (X) | Nilai Ujian (Y) | Nilai Prediksi (Y’) |
|——-|—————–|—————–|———————-|
| 1 | 2 | 58 | \( 56 + 4(2) = 64 \) |
| 2 | 3 | 64 | \( 56 + 4(3) = 68 \) |
| 3 | 4 | 70 | \( 56 + 4(4) = 72 \) |
| 4 | 5 | 85 | \( 56 + 4(5) = 76 \) |
| 5 | 2 | 57 | \( 56 + 4(2) = 64 \) |
| 6 | 3 | 68 | \( 56 + 4(3) = 68 \) |
| 7 | 4 | 72 | \( 56 + 4(4) = 72 \) |
| 8 | 5 | 90 | \( 56 + 4(5) = 76 \) |
| 9 | 3 | 62 | \( 56 + 4(3) = 68 \) |
| 10 | 4 | 78 | \( 56 + 4(4) = 72 \) |
3. Menghitung SSR dan SST
Berikutnya, kita hitung SSR dan SST untuk mendapatkan \( R^2 \).
SSR:
\[ SSR = \sum{(Y – Y’)^2} \]
\[ SSR = (58 – 64)^2 + (64 – 68)^2 + (70 – 72)^2 + (85 – 76)^2 + (57 – 64)^2 + (68 – 68)^2 + (72 – 72)^2 + (90 – 76)^2 + (62 – 68)^2 + (78 – 72)^2 \]
\[ SSR = 36 + 16 + 4 + 81 + 49 + 0 + 0 + 196 + 36 + 36 \]
\[ SSR = 454 \]
SST:
\[ SST = \sum{(Y – \bar{Y})^2} \]
Di mana:
\[ \bar{Y} = \frac{\sum{Y}}{n} = \frac{704}{10} = 70.4 \]
\[ SST = (58 – 70.4)^2 + (64 – 70.4)^2 + (70 – 70.4)^2 + (85 – 70.4)^2 + (57 – 70.4)^2 + (68 – 70.4)^2 + (72 – 70.4)^2 + (90 – 70.4)^2 + (62 – 70.4)^2 + (78 – 70.4)^2 \]
\[ SST = 153.76 + 40.96 + 0.16 + 213.16 + 178.56 + 5.76 + 2.56 + 384.16 + 70.56 + 57.76 \]
\[ SST = 1107.44 \]
4. Menghitung Koefisien Determinasi \( R^2 \):
\[ R^2 = 1 – \frac{SSR}{SST} \]
\[ R^2 = 1 – \frac{454}{1107.44} \]
\[ R^2 = 1 – 0.41 \]
\[ R^2 = 0.59 \]
Kesimpulan
Dari hasil perhitungan di atas, didapatkan nilai koefisien determinasi \( R^2 = 0.59 \). Ini menunjukkan bahwa model regresi linier yang kita buat mampu menjelaskan sekitar 59% dari variabilitas data nilai ujian berdasarkan jumlah jam belajar. Sedangkan 41% variabilitas lainnya bisa disebabkan oleh faktor lain yang tidak dimasukkan dalam model.
Dengan memahami langkah-langkah dan perhitungan di atas, kita dapat melihat pentingnya koefisien determinasi dalam menilai seberapa baik model regresi yang kita bangun dalam menjelaskan variabilitas data sebenarnya. Ini adalah alat yang sangat berguna dalam analisis statistik dan pemodelan data.