EKONOMETRIKA
www.uniba.ac.id
BAB
IV
REGRESI
LINIER BERGANDA
1.
RANGKUMAN
A. Pengertian
Regresi linier Berganda
Model regresi
dimana variabel X lebih dari satu, yang mana itu sangat memungkinkan, karena
dalam keilmuan sosial semua faktor-faktor atau variabel-variabel saling
berkaitan satu dengan lainnya. Artinya, variabel X bisa berjumlah 2, 3, atau
lebih. Jumlah X yang lebih dari satu tersebut terkenal dengan istilah Regresi
Linier Berganda atau multiple linier regression.
B.
Model Regresi Linier Berganda
Penulisan model
regresi linier berganda merupakan pengembangan dari model regresi linier
tunggal. Model regresi linier umumnya dituliskan sebagai berikut:
Populasi: Y = A
+ B1X1 + B2X2 + B3X3
+ ………+BnXn + e
Atau Y = B0 + B1X1
+ B2X2 + B3X3 + ………+ BnXn + e
Sampel : Y = a +
b1X1 + b2X2 + b3X3
+ ………+ bnXn+ e
Atau Y = b0 + b1X1
+ b2X2 + b3X3 + ………+ bnXn + e
Penulisan cara
di atas adalah bentuk model yang sering dijumpai dalam beberapa literatur.
Notasi model seperti itu tentu berbeda dengan notasi model Yale.
C.
Penghitungan Nilai Parameter
Penggunaan
metode OLS dalam regresi linier berganda dimaksudkan untuk mendapatkan aturan
dalam mengestimasi parameter yang tidak diketahui. Prinsip yang terkandung
dalam OLS sendiri adalah untuk meminimalisasi perbedaan jumlah kuadrat kesalahan
(sum of square) antara nilai observasi Y dengan Yˆ .
Secara matematis, fungsi minimalisasi sum of square ditunjukkan dalam
rumus:
Untuk
mendapatkan estimasi least square b0, b1,b2 minimum, dapat dilakukan
melalui cara turunan parsial (partially differentiate) dari formula di
atas, sebagai berikut:
Jadikan
nilai-nilai turunan parsial di atas menjadi sama dengan 0 (nol), dengan cara
membagi dengan angka 2, hingga menjadi:
Untuk
menyederhanakan rumus paling atas dilakukan pembagian dengan n, sehingga
memperoleh rumus baru sebagai berikut:
Kalau kita notasikan:
maka b1 dan b2 dapat dicari dengan
rumus:
Oleh karena itu
pencarian nilai b mengalami perubahan.Guna mengetahui seberapa besar
kontribusi X1 terhadap perubahan Y, tentu perlu untuk melakukan kontrol
pengaruh dari X2. Begitu pula, untuk mengetahui kontribusi X2,
maka perlu juga melakukan control terhadap X1. Dari sini dapat
timbul pertanyaan, bagaimana caranya mengontrolnya? Untuk menjawabnya, perlu
ilustrasi secara konkrit agar mudah dipahami.
Misalnya kita
hendak mengontrol pengaruh linier X2 ketika melakukan pengukuran
dampak dari perubahan X1 terhadap Y, maka dapat melakukan
langkah-langkah sebagai berikut:
Tahap pertama: lakukan regresi Y
terhadap X2.
Y = b0 + b2 X2
+ e1
Dimana e1 merupakan residual, yang
besarnya:
e1 = Y – b0 – b2X2
= Y-Yˆ
Tahap kedua: lakukan regresi X1 terhadap
X2
X1 = b0 + b2
X2 + e2
Dimana e1 merupakan residual, yang
besarnya:
e2 = X1 – b0
– b2X2
= X1-Xˆ
Tahap ketiga: lakukan regresi e1
terhadap e2
e1 = a0 + a1e2
+e3
Besarnya a1 pada
tahap ketiga inilah yangmerupakan nilai pasti atau net effect dari
perubahan satu unit X1 terhadap Y, atau menunjukkan kemiringan (slope)
garis Y atas variabel X1. Logika dari teori tersebut yang mendasari rumus
yang dapat digunakan untuk menentukan koefisien regresi parsial (partial
regression coefficients) (baca: b1, b2). Dengan
memanfaatkan data yang telah tersedia, kita dapat pula menentukan nilai b1
variabel Budep maupun b2 variabel Kurs. Pencarian koefisien regresi
tersebut dapat dilakukan dengan menggunakan rumus-rumus yang telah ditentukan
di atas. Guna mempermudah alam memasukkan
angka-angka ke dalam rumus, maka data yang ada perlu diekstensifkan sesuai
dengan kebutuhan rumus tersebut. Hasil ekstensifikasi dari beberapa rumus yang
dicari sebagai berikut:
Dengan
menggunakan rumus-rumus tersebut di atas, maka nilai total masing-masing
komponen rumus yang dikembangkan adalah tertera sebagai berikut:
Berdasarkan
data-data yang tertera dalam tabel di atas, maka nilai b0, b1, dan b2 dapat
ditentukan, melalui pencarian menggunakan rumus-rumus sebagai berikut:
Rumus untuk
mencari nilai b1 (pada model multiple regression) adalah:
Rumus untuk
mencari nilai b2 (pada model multiple regression) adalah:
Rumus untuk mencari nilai b0 (pada model multiple regression) adalah:
Nilai dari
parameter b1 dan b2 merupakan nilai darisuatu sampel. Nilai b1 dan b2
tergantung pada jumlahsampel yang ditarik. Penambahan atau pengurangan
akanmengakibatkan perubahan rentangan nilai b. Perubahan rentang nilai b1 dan
b2 diukur dengan standar error. Semakin besar standar error mencerminkan
nilai b sebagai penduga populasi semakin kurang representatif. Sebaliknya,
semakin kecil standar error maka keakuratan daya penduga nilai b
terhadap populasi semakin tinggi. Perbandingan antara nilai b dan standar
error ini memunculkan nilai t, yang dapat dirumuskan sebagai berikut:
dimana:
b = nilai
parameter
Sb = standar
error dari b. Jika b sama dengan 0 (b=0) atau
Sb bernilai
sangat besar, maka nilai t akan sama dengan atau mendekati 0 (nol).
Untuk dapat
melakukan uji t, perlu menghitung besarnya standar error masing-masing
parameter ( baik b0, b1, b2), seperti diformulakan Gujarati (1995:198-199)
sebagai berikut:
A.
Koefisien Determinasi (R2)
Koefisien
determinasi pada dasarnya digunakan untuk mengukur goodness of fit dari
persamaan regresi,melalui hasil pengukuran dalam bentuk prosentase yang menjelaskan
determinasi variabel penjelas (X) terhadap variabel yang dijelaskan (Y).
Koefisien determinasi dapat dicari melalui hasil bagi dari total sum of
square (TSS)atau total variasi Y terhadap explained sum of square(ESS)
atau variasi yang dijelaskan Y. Dengan demikian kita dapat mendefinisikan lagi
R2 dengan arti rasio antara variasi yang dijelaskan Y dengan total
variasi Y.
Rumus tersebut
adalah sebagai berikut:
Total variasi Y
(TSS) dapat diukur menggunakan derajat deviasi dari masing-masing observasi
nilai Y dari rata-ratanya. Hasil pengukuran ini kemudian dijumlahkan hingga
mencakup seluruh observasi. Jelasnya:
Nilai explained
sum of square (ESS) atau variasi yang dijelaskan Y didapat dengan
menggunakan rumus sebagai berikut:
Jadi, rumus di atas dapat pula
dituliskan menjadi sebagai berikut:
dimana:
Yˆ
(baca: Y cap) adalah nilai perkiraan Y atau estimasi garis regresi.
Y
(baca:
Y bar) adalah nilai Y rata-rata.
Y
cap diperoleh dengan cara menghitung hasil regresi dengan memasukkan
nilai parameter dan data variabel. Penghitungan nilai Y cap menjadi penting
untuk dilakukan agar mempermudah kita dalam menggunakan rumus R2
yang telah ditentukan di atas.
A.
Uji F
Pengujian secara
serentak tersebut dilakukan dengan teknik analisis of variance (ANOVA)
melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel. Oleh
karena itu disebut pula dengan uji F. Pada
prinsipnya, teknik ANOVA digunakan untuk menguji distribusi atau variansi means
dalam variabel penjelas apakah secara proporsional telah signifikan
menjelaskan variasi dari variabel yang dijelaskan. Untuk memastikan jawabannya,
maka perlu dihitung rasio antara variansi means (variance between means)
yang dibandingkan dengan variansi di dalam kelompok variabel (variance
between group). Hasil pembandingan keduanya itu (rasio antara variance
between means terhadap variance between group) menghasilkan nilai F
hitung, yang kemudian dibandingkan dengan nilai F tabel. Jika nilai F hitung
lebih besar dibanding nilai F tabel, maka secara serentak seluruh variabel
penjelas yang ada dalam model signifikan mempengaruhi variabel terikat Y.
Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan nilai F tabel,
maka tidak secara serentak seluruh variabel penjelas yang ada dalam model
signifikan mempengaruhi variabel terikat Y. Atau secara ringkas dapat dituliskan
sebagai berikut:
H0 diterima atau
ditolak, adalah merupakan suatu keputusan jawaban terhadap hipotesis yang
terkait dengan uji F, yang biasanya dituliskan dalam kalimat sebagai berikut:
H0 : b1 = b2 = 0
Variabel penjelas secara serentak tidak signifikan mempengaruhi variabel yang
dijelaskan.
H0 : b1 ≠ b2 ≠ 0
Variabel penjelas secara serentak signifikan mempengaruhi variabel yang
dijelaskan.
Karena uji F
adalah membandingkan antara nilai F hitung dengan nilai F tabel, maka penting
untuk mengetahui bagaimana mencari nilai F hitung ataupun nilai F tabel. Nilai
F hitung dapat dicari dengan menggunakan rumus sebagai berikut:
Sedangkan nilai
F tabel telah ditentukan dalam tabel. Yang penting untuk diketahui adalah
bagaimana cara membaca tabelnya. Seperti yang telah dituliskan pada
pembandingan antara nilai F hitung dan nilai F tabel di atas, diketahui bahwa F
tabel dituliskan Fα;k-1; (n-k).
Arti dari
tulisan tersebut adalah:
·
Simbol α menjelaskan tingkat
signifikansi (level of significance) (apakah pada α = 0,05 atau α = 0,01 ataukah α = 0,10, dan seterusnya)
·
Simbol (k-1) menunjukkan degrees of
freedom for numerator.
·
Simbol (n-k) menunjukkan degrees of
freedom for denominator.
2.
Kesimpulan uraian bab diatas !
Analisis
regresi linier berganda adalah hubungan secara linear antara dua atau lebih
variabel independen (X1, X2,….Xn) dengan
variabel dependen (Y). Analisis ini untuk mengetahui arah hubungan antara
variabel independen dengan variabel dependen apakah masing-masing variabel
independen berhubungan positif atau negatif dan untuk memprediksi nilai dari
variabel dependen apabila nilai variabel independen mengalami kenaikan atau
penurunan. Data yang digunakan biasanya berskala interval atau rasio.
3.
Soal dan Jawaban !
a.
Coba jelaskan apa yang dimaksud dengan regresi linier berganda!
Jawab
:
Model regresi
dimana variabel X lebih dari satu, yang mana itu sangat memungkinkan, karena
dalam keilmuan sosial semua faktor-faktor atau variabel-variabel saling
berkaitan satu dengan lainnya. Artinya, variabel X bisa berjumlah 2, 3, atau
lebih. Jumlah X yang lebih dari satu tersebut terkenal dengan istilah Regresi
Linier Berganda atau multiple linier regression.
b.
Coba tuliskan model regresi linier berganda!
Jawab
:
Populasi: Y = A
+ B1X1 + B2X2 + B3X3
+ ………+BnXn + e
Atau Y = B0 + B1X1
+ B2X2 + B3X3 + ………+ BnXn + e
Sampel : Y = a +
b1X1 + b2X2 + b3X3
+ ………+ bnXn+ e
Atau Y = b0 + b1X1
+ b2X2 + b3X3 + ………+ bnXn + e
c.
Coba uraikan arti dari notasi atas model yang telah anda tuliskan!
Jawab
:
Y :
merupakan variabel dependen
A,a
atau
B0, b0 : merupakan konstanta
atau intercept
B1,B2,B3,…Bn
atau b1,b2,b3,…bn : merupakan koefisien regresi, yang juga menggambarkan
tingkat elastisitas variabel independen
X1,X2,X3,…Xn
: merupakan variabel independen
e : standar error
d.
Jelaskan informasi apa yang dapat diungkap pada konstanta!
Jawab
: Konstanta atau yang disimbolkan dengan huruf A,a atau B0,
b0 merupakan sikap dasar dari variabel dependen. Menjelaskan
tentang seberapa besar faktor-faktor yang bersifat tetap dari variabel
dependen.
e.
Jelaskan informasi apa yang dapat diungkap pada koefisien regresi!
Jawab
: Berdasarkan rumus regresi, koefisien (b) dinamakan
koefisien arah regresi linier yang fungsinya menyatakan perubahan rata-rata
variabel (Y) untuk setiap perubahan
variabel (X) sebesar satu satuan. Koefisien
(b) regresi linier adalah nilai dari variabel (X) yang bisa bermakna positif
atau negatif, yang fungsinya mempengaruhi variabel (Y). Jika nilai variabel X
positif maka akan berpengaruh naik terhadap variabel Y, akan tetapi jika nilai
variabel X ternyata negatif justru akan berpengaruh turun terhadap variabel Y. Makna
positif (+) atau negatif (-) tersebut diinterpretasikan dalam
besaran satuan. Jika positif maka naik sebesar satu satuan, jika negatif maka
turun sebesar satu satuan.
f.
Coba sebutkan perbedaan-perbedaan antara model regresi linier sederhana dengan
model regresi linier berganda!
Jawab
:
1. Pencarian
nilai b pada single linier berbeda dengan multiple linier.
Perbedaan ini muncul karena jumlah variabel penjelasnya bertambah. Semakin
banyaknya variabel X ini maka kemungkinan-kemungkinan yang menjelaskan model
juga mengalami pertambahan.
Dalam single linier kemungkinan perubahan
variabel lain tidak terjadi, tetapi dalam multiple linier hal itu
terjadi. Misalnya, Jika terjadiperubahan pada X1, meskipun X2
konstan, akan mampu merubah nilai harapan dari Y. Begitu pula, perubahan
pada X2, meskipun X1 konstan, akan mampu merubah nilai
harapan dari Y. Perubahan yang terjadi pada X1 atau X2
tentu mengakibatkan perubahan nilai harapan Y atau E(Y/X1,X2)
yang berbeda.
2. Rumus
dalam Uji t, Uji F, maupun dalam mencari
koefisien Determinasi (R2) pun berbeda,
g.
Jelaskan mengapa rumus untuk mencari nilai b pada model regresi linier berganda
berbeda dengan model regresi linier sederhana!
Jawab
: Perbedaan ini muncul ka1rena jumlah
variabel penjelasnya bertambah. Semakin banyaknya variabel X ini maka
kemungkinan-kemungkinan yang menjelaskan model juga mengalami pertambahan.
Dalam single linier kemungkinan perubahan variabel lain tidak terjadi,
tetapi dalam multiple linier hal itu terjadi. Misalnya, Jika terjadi perubahan
pada X1, meskipun X2 konstan, akan mampu merubah
nilai harapan dari Y. Begitu pula, perubahan pada X2, meskipun X1
konstan, akan mampu merubah nilai harapan dari Y. Perubahan yang terjadi pada X1
atauX2 tentu mengakibatkan perubahan nilai harapan Y atau E(Y/X,X2)
yang berbeda. Oleh karena itu pencarian nilai b mengalami perubahan.Guna
mengetahui seberapa besar kontribusi X1 terhadap perubahan Y, tentu
perlu untuk melakukan kontrol pengaruh dari X2. Begitu pula, untuk
mengetahui kontribusi X2, maka perlu juga melakukan control terhadap
X1.
h.
Coba jelaskan apakah pencarian nilai t juga mengalami perubahan! kenapa?
Jawab
:
Nilai t merupakan hasil bagi antara b dengan Sb. Pencarian nilai t mempunyai
kesamaan dengan model regresi linier sederhana, hanya saja pencarian Sb nya
yang berbeda. Pencarian masing-masing nilai t dapat dirumuskan sebagai berikut:
i.
Coba uraikan bagaimana menentukan nilai t yang signifikan!
Jawab
: Untuk dapat mengetahui
apakah signifikan atau tidak nilai t hitung tersebut, maka perlu membandingkan
dengan nilai t tabel. Apabila nilai t hitung lebih besar dibandingkan dengan
nilai t tabel, maka variabel penjelas tersebut signifikan. Sebaliknya, jika
nilai t hitung lebih kecil darit tabel, maka variabel penjelas tersebut tidak
signifikan.
j.
Jelaskan apa kegunaan nilai F!
jawab
: Dalam regresi linier berganda variabel
penjelasnya selalu berjumlah lebih dari satu. Untuk itu, maka pengujian tingkat
signifikansi variabel tidak hanya dilakukan secara individual saja, seperti
dilakukan dengan uji t, tetapi dapat pula dilakukan pengujian secara serentak
atau bersama-sama. Itulah, kegunaan dari nilai F yaitu untuk pengujian
signifikansi semua variabel penjelas secara serentak atau bersama-sama. Yang
dapat dilakukan dengan teknik analisis of variance (ANOVA)
melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel. Oleh
karena itu disebut pula dengan uji F.
k.
Bagaimana menentukan nilai F yang signifikan?
Jawab
: Pengujian secara serentak tersebut dilakukan dengan
teknik analisis of variance (ANOVA) melalui pengujian nilai F
hitung yang dibandingkan dengan nilai F tabel. Oleh karena itu disebut pula
dengan uji F.
Karena uji F
adalah membandingkan antara nilai F hitung dengan nilai F tabel, maka penting
untuk mengetahui bagaimana mencari nilai F hitung ataupun nilai F tabel. Nilai
F hitung dapat dicari dengan menggunakan rumus sebagai berikut:
Sedangkan nilai
F tabel telah ditentukan dalam tabel. Yang penting untuk diketahui adalah
bagaimana cara membaca tabelnya. Seperti yang telah dituliskan pada
pembandingan antara nilai F hitung dan nilai F tabel di atas, diketahui bahwa F
tabel dituliskan Fα;k-1; (n-k).
Arti dari
tulisan tersebut adalah:
·
Simbol α menjelaskan tingkat
signifikansi (level of significance) (apakah pada α = 0,05 atau α = 0,01 ataukah α = 0,10, dan seterusnya)
·
Simbol (k-1) menunjukkan degrees of
freedom for numerator.
·
Simbol (n-k) menunjukkan degrees of
freedom for denominator.
l.
Jelaskan apakah rumus dalam mencari koefisien determinasi pada model regresi
linier berganda berbeda dengan regresi linier sederhana! kenapa?
Jawab
:
·
Untuk menentukan koefisien determinasi
(R2) pada regresi linier sederhana, dapat dihitung dengan rumus
sebagai berikut:
·
Dalam perhitungan menggunakan rumus
koefisien determinasi (R2) pada regresi berganda berbeda dengan koefisien
determinasi (R2) pada regresi linier sederhana, karena dalam
menentukan Koefisien determinasi dapat dicari melalui hasil bagi dari total
sum of square (TSS)atau total variasi Y terhadap explained sum of square(ESS)
atau variasi yang dijelaskan Y. Dengan demikian kita dapat mendefinisikan lagi
R2 dengan arti rasio antara variasi yang dijelaskan Y dengan total
variasi Y.
Rumus
tersebut adalah sebagai berikut:
Total variasi Y (TSS) dapat diukur
menggunakan derajat deviasi dari masing-masing observasi nilai Y dari
rata-ratanya. Hasil pengukuran ini kemudian dijumlahkan hingga mencakup seluruh
observasi. Jelasnya:
Nilai explained sum of square (ESS)
atau variasi yang dijelaskan Y didapat dengan menggunakan rumus sebagai
berikut:
Jadi, rumus di
atas dapat pula dituliskan menjadi sebagai berikut:
dimana:
Yˆ
(baca: Y cap) adalah nilai perkiraan Y atau estimasi garis regresi.
Y
(baca:
Y bar) adalah nilai Y rata-rata.
m.
Jelaskan bagaimana variabel penjelas dapat dianggap sebagai prediktor terbaik
dalam menjelaskan Y!
jawab
:
Jika nilai F
hitung lebih besar dibanding nilai F tabel, maka secara serentak seluruh
variabel penjelas yang ada dalam model signifikan mempengaruhi variabel terikat
Y. Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan nilai F
tabel, maka tidak secara serentak seluruh variabel penjelas yang ada dalam
model signifikan mempengaruhi variabel terikat Y. Atau secara ringkas dapat dituliskan
sebagai berikut:
H0 diterima atau
ditolak, adalah merupakan suatu keputusan jawaban terhadap hipotesis yang
terkait dengan uji F, yang biasanya dituliskan dalam kalimat sebagai berikut:
H0 : b1 = b2 = 0
Variabel penjelas secara serentak tidak signifikan mempengaruhi variabel yang
dijelaskan.
H0 : b1 ≠ b2 ≠ 0
Variabel penjelas secara serentak signifikan mempengaruhi variabel yang
dijelaskan.
www.uniba.ac.id
Komentar
Posting Komentar