***************** Beispiele zur Regressionsanalyse mit STATA *********** ************ A. Simulation von Daten: exogene Variablen **************** set obs 100 gen e1=invnorm(uniform()) gen e2=0.5*invnorm(uniform()) generate x1=uniform()*3 gen x2=1.5*x1+e1 generate x3=uniform() gen A=1 if x3<=0.4 replace A=2 if x3<=0.7 & x3>0.4 replace A=3 if x3>0.7 ** Erzeugen beispiel fuer bivariate Regression gen y1=1.5+2*x1+e1 label var y1 "Bivariate lineare Regression" ** Erzeugen Beispiel fuer trivariate Regression gen y2=-3 + x2 -3*x1 + e2 label var y2 "Trivariate lin. Regression" ** Beispiel zur trivariaten Regression mit Varianzheteroskedastizitaet gen y2a=-3 + x2 -3*x1 + x1*e2/1.5 label var y2a "Hetereosekdast. Residuen (Varianz=f(y1)" ** Beispiel zur nichtlinearen (quadratischen) Vorhersagefunktion gen y2b=-5 + x2 +0.5*x2*x2 -3*x1 + e2 label var y2b "nichtlin. Regression bei x2" ** Beispiel zur Verzerrung durch Ausreiáer gen id=_n gen y2c=1-0.5*x1 + e1 replace y2c=3+10*x1 +e1 if id==50 label var y2c "verzerrung durch Ausreisser" ** Beispiel zu kategorialen Praediktoren gen y3=1 + x1 + e2 if A==1 replace y3=2.5 + x1 + e2 if A==2 replace y3=3 + x1 + e2 if A==3 label var y3 "kategorialer Praediktor" * Datensatz zur Analyse aufbereiten drop e1 e2 x3 move id x1 more ******************************************************************** ***************** B. Regressionsanalysen mit STATA ****************** ****** 1. bivariates Scatterplot für Inspektion graph y1 x1 more ***** 2. bivariate Regression mit deskriptiver Statistik correlate y1 x1, mean regress y1 x1 ** 2a. Speichern der Vorhersagewerte und Scatterplot mit Regressionsgerade predict y1hat graph y1 y1hat x1 , connect (.l) symbol (oi) sort more ** 2b. Beipsiel zur Unkorreliertheit der Residuen mit Praediktoren predict e1, resid correlate e1 x1, mean more ***** 3. trivariate Regression correlate y2 x1 x2, mean regress y2 x1 x2 more ** 3a. grafische Darstellung Regressionsgerade bei 2 Werten von X1 gen y21=_b[_cons]+_b[x2]*x2 +_b[x1]*1 gen y22=_b[_cons]+_b[x2]*x2 +_b[x1]*2 graph y2 y21 y22 x2 , connect (.ss) symbol (oii) more ** 3b. partielle Koeffizienten als bivariate Residuenregression regress y2 x1 predict ey1, resid regress x2 x1 predict e21, resid regress ey1 e21 regress y2 x1 x2, beta more ** 3c. Korrelation der Schaetzungen zur Kontrolle von Multikollinearität correlate, _coef more ***** 4. Residuenanalyse - Residuen gegen Vorhersagewerte predict y2hat predict e2 ,resid correlate y2hat e2, mean graph e2 y2hat more ** 4a. Pruefung der Normalverteilung der Residuen graph e2, norm more qnorm e2 more ** 4b. graphische Pruefung der Heteroskedastizitaet regress y2 x1 x2 more graph e2 y2hat more regress y2a x1 x2 predict y2ahat predict e2a , resid more graph e2a y2ahat more graph e2a x1 more graph e2a x2 more ** 4c. grafisches Aufdecken nichtlinearer Beziehungen regress y2 x1 x2 cprplot x2, connect(m) bands(10) more regress y2b x1 x2 cprplot x2, connect(m) bands(10) more gen x3=x2*x2 regress y2b x1 x2 x3 more predict y2bhat predict e2b ,resid cprplot x2, connect(m) bands(10) more ** 4d Ausreisseranalyse graph y2c x1 more regress y2c x1 predict lever , hat predict influ , cooksd more graph lever, box more graph influ, box summarize influ more gen idausr=1 if influ > 0.2 list id y2c x1 if idausr==1 more regress y2c x1 regress y2c x1 if idausr==. more ***** 5. Regressions mit nominalskalierten Praediktoren tab A gen d1= A==1 gen d2= A==2 gen d3= A==3 regress y3 x1 d1 d2 d3 more regress d1 d2 d3 more regress y3 d1 d2 regress y3 d1 d3 regress y3 d2 d3