Contoh Soal dan Pembahasan Regresi Linear
Regresi linear adalah salah satu metode statistik yang digunakan untuk menentukan hubungan antara dua variabel atau lebih. Metode ini banyak digunakan dalam berbagai bidang, termasuk ekonomi, bisnis, ilmu sosial, dan ilmu alam. Pada artikel ini, kita akan membahas apa itu regresi linear, cara menghitungnya, serta beberapa contoh soal lengkap dengan pembahasannya agar pembaca bisa memahami konsep ini secara mendalam.
Pengertian Regresi Linear
Regresi linear adalah metode analisis yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen (prediktor) dan variabel dependen (respon). Regresi linear sederhana melibatkan satu variabel independen dan satu variabel dependen, sedangkan regresi linear berganda melibatkan lebih dari satu variabel independen.
Persamaan garis regresi linear sederhana adalah:
\[ Y = a + bX \]
Di mana:
– \( Y \) adalah variabel dependen.
– \( X \) adalah variabel independen.
– \( a \) adalah intersep, yaitu nilai Y saat X = 0.
– \( b \) adalah koefisien regresi, yaitu seberapa besar perubahan Y jika X berubah satu satuan.
Langkah-langkah Regresi Linear
1. Mengumpulkan Data: Pertama, kumpulkan data yang akan dianalisis.
2. Plot Data: Buat scatter plot untuk melihat apakah ada hubungan linear antara variabel-variabel.
3. Hitung Koefisien Regresi: Gunakan metode nilai kurang kuadrat terkecil (least squares method) untuk menentukan garis terbaik.
4. Menguji Model: Uji signifikansi koefisien regresi dengan uji t dan menentukan nilai R-squared untuk melihat seberapa baik model sesuai dengan data.
Contoh Soal dan Pembahasan
Contoh Soal 1: Regresi Linear Sederhana
Soal:
Seorang peneliti ingin mengetahui hubungan antara jumlah jam belajar (X) dan nilai ujian (Y) mahasiswa. Data yang diperoleh adalah sebagai berikut:
| Jam Belajar (X) | Nilai Ujian (Y) |
|—————–|—————–|
| 2 | 70 |
| 3 | 75 |
| 5 | 80 |
| 7 | 85 |
| 8 | 90 |
Buatlah persamaan regresi linear dari data ini!
Pembahasan:
1. Menghitung Rata-rata:
\[
\bar{X} = \frac{2 + 3 + 5 + 7 + 8}{5} = 5
\]
\[
\bar{Y} = \frac{70 + 75 + 80 + 85 + 90}{5} = 80
\]
2. Menghitung Koefisien Regresi \( b \):
\[
b = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sum (X_i – \bar{X})^2}
\]
\[
\sum (X_i – \bar{X})(Y_i – \bar{Y}) = (2 – 5)(70 – 80) + (3 – 5)(75 – 80) + (5 – 5)(80 – 80) + (7 – 5)(85 – 80) + (8 – 5)(90 – 80)
\]
\[
= (-3)(-10) + (-2)(-5) + (0)(0) + (2)(5) + (3)(10) = 30 + 10 + 0 + 10 + 30 = 80
\]
\[
\sum (X_i – \bar{X})^2 = (2 – 5)^2 + (3 – 5)^2 + (5 – 5)^2 + (7 – 5)^2 + (8 – 5)^2
\]
\[
= 9 + 4 + 0 + 4 + 9 = 26
\]
\[
b = \frac{80}{26} \approx 3.08
\]
3. Menghitung Intersep \( a \):
\[
a = \bar{Y} – b\bar{X}
\]
\[
a = 80 – 3.08 \times 5 = 80 – 15.4 = 64.6
\]
4. Persamaan Regresi:
\[
Y = 64.6 + 3.08X
\]
Jadi, persamaan regresi linear dari data tersebut adalah \( Y = 64.6 + 3.08X \). Ini berarti setiap tambahan satu jam belajar diperkirakan akan meningkatkan nilai ujian sebesar 3.08 poin.
Contoh Soal 2: Uji Model dan Interpretasi
Soal:
Lanjutkan dengan data yang sama, hitung nilai R-squared (R²) untuk mengukur seberapa baik model ini sesuai dengan data. Juga, uji signifikansi koefisien regresi \( b \).
Pembahasan:
1. Menghitung Total Sum of Squares (SST), Regression Sum of Squares (SSR), dan Error Sum of Squares (SSE):
\[
SST = \sum (Y_i – \bar{Y})^2
\]
\[
SST = (70 – 80)^2 + (75 – 80)^2 + (80 – 80)^2 + (85 – 80)^2 + (90 – 80)^2 = 100 + 25 + 0 + 25 + 100 = 250
\]
\[
SSR = \sum (\hat{Y}_i – \bar{Y})^2
\]
Dimana \( \hat{Y}_i \) adalah nilai prediksi dari persamaan regresi:
\[
\hat{Y}_i = 64.6 + 3.08X_i
\]
\[
\hat{Y} = [67.76, 70.84, 76.0, 82.16, 85.24]
\]
\[
\bar{Y} = 80
\]
\[
SSR = (67.76 – 80)^2 + (70.84 – 80)^2 + (76.0 – 80)^2 + (82.16 – 80)^2 + (85.24 – 80)^2
\]
\[
SSR = (-12.24)^2 + (-9.16)^2 + (-4.0)^2 + 2.16^2 + 5.24^2 = 149.8
\]
2. Menghitung SSE:
\[
SSE = SST – SSR = 250 – 149.8 = 100.2
\]
3. Menghitung R-squared:
\[
R^2 = \frac{SSR}{SST} = \frac{149.8}{250} \approx 0.6
\]
Nilai R-squared sebesar 0.6 menunjukkan bahwa model ini menjelaskan sekitar 60% variasi dalam data. Ini adalah indikasi bahwa garis regresi cocok dengan data cukup baik.
4. Uji t untuk Signifikansi Koefisien \( b \):
\[
t = \frac{b}{SE(b)}
\]
\[
SE(b) = \sqrt{\frac{SSE}{n-2}} / \sqrt{\sum (X_i – \bar{X})^2}
\]
\[
SE(b) = \sqrt{\frac{100.2}{5-2}} / \sqrt{26}
\]
\[
SE(b) = \sqrt{33.4} / \sqrt{26} \approx 1.13
\]
\[
t = \frac{3.08}{1.13} \approx 2.73
\]
Dengan \( t-statistic \approx 2.73 \), jika kita menggunakan threshold umum untuk signifikansi (α = 0.05), kita bandingkan dengan t-tabel. Misalnya, untuk \( df = 3 \), \( t \) kritis sekitar 2.353. Maka \( t-observed > t-critical \), menunjukkan bahwa koefisien signifikan.
Kesimpulan
Dalam artikel ini, kita telah membahas dasar-dasar regresi linear, cara menghitung koefisien regresi dan intersep, serta bagaimana menginterpretasi hasilnya dengan contoh soal. Penting untuk sering berlatih dengan berbagai set data agar semakin mahir dalam menggunakan metode ini. Regresi linear merupakan alat yang sangat berharga dalam analisis data dan dapat memberikan wawasan yang mendalam mengenai hubungan antara variabel-variabel.