Generelle lineære modeller

Størrelse: px
Starte visningen fra side:

Download "Generelle lineære modeller"

Transkript

1 Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal med en middelværdi, der afhænger af X erne og en varians, der er uafhængig af X erne: E(Y X 1,..,X k ) = f(x 1,..,X k ) = α k + i= 1 β X k k - De uafhængige variable kan være kategorivariable eller kvantitative. - Kategoriske variable omkodes som dummy variable. - Interaktioner kan tilføjes i form af produkt-variable. 1

2 Forskellige specialtilfælde Uafhængige variable Én binær variabel Én kategorivariabel med mere end to kategorier Analysen omtales som t-test Ensidet variansanalyse To eller flere kategorivariable To- eller flersidede variansanalyser En eller flere kvantitative variable Både kategorivariable og kvantitative variable Lineær regression Generelle lineære modeller 2

3 Generelle lineære modeller i praksis En analyse af effekten af køn, alder, rygevaner, fysisk aktivitet og kontrol over eget helbred på BMI Data fra Sundby95 undersøgelsen Afhængig: BMI Uafhængige: Alder Køn Rygevaner Opfattelse af selv at kunne gøre noget for helbredet Fysisk aktivitet i fritiden Fysisk aktivitet i arbejdet 3

4 Det overordnede problem: Hvilken betydning har de afhængige variable for BMI Er der interaktioner mellem effekten af de uafhængige Variable? Underordnede problemer: Er relationen mellem alder og BMI lineær? Er den betingede fordeling af BMI og de andre variable normal? Er varianserne homogene? 4

5 Analyseplanen Indledende databeskrivelse Univariat Bivariat Den indledende analyse kan give ideer til den egentlige analyse, men skal ikke i sig selv føre til egentlige analyseresultater pga. risikoen for confounding. Den egentlige analyse Trinvis modelsøgning Modelkontrol Estimation af parametre i den endelige model 5

6 Univariate analyser BMI Et advarselssignal: Den marginale BMI fordeling er skæv. Skævheden behøver dog ikke at være et problem, fordi fordelingen er en sum af fordelingerne i mange forskellige grupper 6

7 Alder Aldersfordelingen er bestemt ikke normal. Dette er dog ikke noget problem, fordi der ikke er noget krav om at de uafhængige variable skal være normalfordelte. Køn Køn Valid Missing Total 1 Mand 2 Kvinde Total 9 Cumulative Frequency Percent Valid Percent Percent ,7 45,4 45, ,6 54,6 100, ,3 100,0 46 1, ,0 7

8 Rygevaner ryger du Percent ja, dagligt ja, ikke dagligt nej, holdt op for nylig nej, holdt op tidligere nej, aldrig ryger du Advarsel: Relativt få personer i kategori 2 og 3. Overvej at slå kategori 1 og 2 sammen til en ja-kategori og 3 og 4 sammen til en kategori med de tidligere rygere. (Afprøves i forbindelse med ensidede variansanalyser) 8

9 Kontrol over helbredet Kan man gøre noget selv for at bevare et godt helbred? Percent egen indsats vigtig egen indsats af nogen betydning tro ikke på egen indsats Kan man gøre noget selv for at bevare et godt helbred? Advarsel: Meget få, der ikke tror på effekten af egen indsats. Indholdsmæssigt er denne gruppe så speciel, at det vil være forkert at slå den sammen med midterkategorien. Der er dog så få i denne gruppe, at det må forudses, at det vil være vanskeligt at påvise statistisk at der skulle være forskel på denne gruppe og de to andre. 9

10 Fysisk aktivitet fysisk aktivitet i fritid Percent meget noget lidt slet ikke fysisk aktivitet i fritid fysisk aktivitet i hovedbeskæftigelse Percent meget noget lidt slet ikke fysisk aktivitet i hovedbeskæftigelse Overvej at slå meget og noget sammen til en kategori 10

11 Lineær regressionsanalyse af alderens betydning 50,00 40,00 bmi 30,00 20,00 R Sq Quadratic =0,091 10,00 20,00 40,00 60,00 80,00 100,00 alder Scatterplottet afslører en klar kvadratisk tendens, hvor BMI først stiger og derefter falder. Denne tendens bør inddrages i analyserne 11

12 For at prøve nødvendigheden af at beskrive relationen mellem BMI og alder ved en ikke-lineær relation beregnes ALDERSQR = Alder 2 ALDERCUB = Alder 3 der begge inddrages i den lineære regressionsanalyse. Regressionsmodellen: BMI = α + β 1 Alder + β 2 ALDERSQR + β 3 ALDERCUB + ε Hvis β 3 = 0 er relationen lineær eller kvadratisk Hvis β 2 = 0 og β 3 = 0 er relationen lineær Residualerne skal stadig være normale og der må ikke være systematiske tegn på variansheterogenitet 12

13 Analysen: Model 1 (Constant) alder aldersqr aldercub a. Dependent Variable: bmi Unstandardized Coefficients Coefficients a Standardized Coefficients B Std. Error Beta t Sig. 20,427 1,261 16,200,000,039,087,192,442,659,003,002 1,270 1,388,165-3,0E-005,000-1,268-2,536,011 Signifikant effekt af det kubiske led. En kvadratisk model er derfor ikke tilstrækkelig til at beskrive sammenhængen mellem alder og BMI. ALDER og ALDERSQR bør fortsat være en del af modellen selvom de ikke er signifikante. 13

14 Residualplots Histogram Dependent Variable: bmi Frequency Regression Standardized Residual 6 Mean = -1,96E-14 Std. Dev. = 0,999 N = Normal P-P Plot of Regression Standardized Residual 1,0 Dependent Variable: bmi 0,8 Expected Cum Prob 0,6 0,4 0,2 0,0 0,0 0,2 0,4 0,6 Observed Cum Prob 0,8 1,0 Residualerne er ikke normalfordelte! 14

15 Varianshomogenitet? Scatterplot Dependent Variable: bmi 6 Regression Standardized Residual Regression Standardized Predicted Value 2 Ingen åbenlyse tegn på variansheterogenitet 15

16 Forsøg at transformere den afhængige variabel, hvis der er tegn på ikke-normale residualer eller heterogene residualer Logaritmetransformationer eller kvadratrødder er erfaringsmæssigt fornuftige ting at forsøge med. Lineær regression af ln(bmi) Unstandardized Coefficients Coefficients a Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 3,001,051 58,947,000 alder,003,004,370,852,394 aldersqr 7,27E-005,000,896,979,328 aldercub -1,0E-006,000-1,067-2,135,033 a. Dependent Variable: lnbmi Der er stadig brug for et 3. grads led 16

17 Residualplots Histogram Dependent Variable: lnbmi Frequency Mean = 1,73E-14 Std. Dev. = 0,999 N = Regression Standardized Residual 17

18 Normal P-P Plot of Regression Standardized Residual 1,0 Dependent Variable: lnbmi 0,8 Expected Cum Prob 0,6 0,4 0,2 0,0 0,0 0,2 0,4 0,6 0,8 1,0 Observed Cum Prob Perfekt tilpasning til normalfordelingen De efterfølgende analyser vil derfor også inddrage logaritmerne til BMI 18

19 Kønsforskelle? (t-test) bmi lnbmi Køn 1 Mand 2 Kvinde 1 Mand 2 Kvinde Group Statistics Std. Error N Mean Std. Deviation Mean ,4579 3,40099, ,0877 3,85049, ,1879,13329, ,1265,15739,00421 Independent Samples Test bmi lnbmi Equal variances assumed Equal variances not assumed Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t df Sig. (2-tailed) t-test for Equality of Means Mean Difference 95% Confidence Interval of the Std. Error Difference Difference Lower Upper 19,677,000 9, ,000 1,37022, , , , ,263,000 1,37022, , , ,442,000 10, ,000,06138,00580,05001, , ,998,000,06138,00572,05017,07260 Stærk evidens, både for variansheterogenitet og forskellige middelværdier 19

20 BMI og ln(bmi) i forhold til rygevaner bmi lnbmi 1,0 ja, dagligt 2,0 ja, ikke dagligt 3,0 nej, holdt op for nylig 4,0 nej, holdt op tidligere 5,0 nej, aldrig Total 1,0 ja, dagligt 2,0 ja, ikke dagligt 3,0 nej, holdt op for nylig 4,0 nej, holdt op tidligere 5,0 nej, aldrig Total Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum ,4164 3,62781, , , ,67 43, ,1531 3,40384, , , ,63 34, ,3521 2,86848, , , ,25 33, ,8173 3,99798, , , ,01 41, ,6202 3,69363, , , ,32 44, ,7140 3,71887, , , ,63 44, ,1421,14884, ,1324 3,1519 2,62 3, ,1315,14643, ,1104 3,1526 2,45 3, ,1435,12007, ,1149 3,1721 2,90 3, ,1994,15410, ,1849 3,2138 2,83 3, ,1508,14843, ,1412 3,1603 2,73 3, ,1545,15013, ,1487 3,1604 2,45 3,79 20

21 Test of Homogeneity of Variances bmi lnbmi Levene Statistic df1 df2 Sig. 2, ,034 1, ,305 Klart mindre færre problemer med variansheterogeniteten for logaritmen til BMI ANOVA bmi lnbmi Between Groups Within Groups Total Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 690, ,577 12,711, , , , ,142 4,286 12,912,000 55, ,022 56, Klart signifikant forskel på grupperne 21

22 Multiple Comparisons Dependent Variable: lnbmi Bonferroni (I) ryger du 1,0 ja, dagligt 2,0 ja, ikke dagligt 3,0 nej, holdt op for nylig 4,0 nej, holdt op tidligere 5,0 nej, aldrig (J) ryger du 2,0 ja, ikke dagligt 3,0 nej, holdt op for nylig 4,0 nej, holdt op tidligere 5,0 nej, aldrig 1,0 ja, dagligt 3,0 nej, holdt op for nylig 4,0 nej, holdt op tidligere 5,0 nej, aldrig 1,0 ja, dagligt 2,0 ja, ikke dagligt 4,0 nej, holdt op tidligere 5,0 nej, aldrig 1,0 ja, dagligt 2,0 ja, ikke dagligt 3,0 nej, holdt op for nylig 5,0 nej, aldrig 1,0 ja, dagligt 2,0 ja, ikke dagligt 3,0 nej, holdt op for nylig 4,0 nej, holdt op tidligere *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound,01062, ,000 -,0229,0441 -,00136, ,000 -,0532,0505 -,05726*,00866,000 -,0816 -,0329 -,00864, ,000 -,0282,0109 -,01062, ,000 -,0441,0229 -,01198, ,000 -,0705,0465 -,06788*,01296,000 -,1043 -,0315 -,01926, ,000 -,0527,0142,00136, ,000 -,0505,0532,01198, ,000 -,0465,0705 -,05590*,01914,035 -,1097 -,0021 -,00728, ,000 -,0591,0445,05726*,00866,000,0329,0816,06788*,01296,000,0315,1043,05590*,01914,035,0021,1097,04862*,00862,000,0244,0728,00864, ,000 -,0109,0282,01926, ,000 -,0142,0527,00728, ,000 -,0445,0591 -,04862*,00862,000 -,0728 -,0244 Gruppen, der er hold op for nylig er ikke forskellige fra rygerne. Der er til gengæld klar forskel på aldrig og tidligere rygere. De tre første kategorier slås sammen til en i de efterfølgende analyser 22

23 Analyser af ln(bmi) i forhold til andre variable Uafhængig variabel Kontrol over eget helbred Fysisk aktivitet i fritid Fysisk aktivitet på arbejde Resultat Meget svag evidens for effekt. Ingen tegn på variansheterogenitet Ingen forskel på meget og noget aktiv, der derfor slås sammen, men tegn på heterogene varianser Ingen forskel på meget og noget aktiv, der derfor slås sammen. Varianserne er homogene. 23

24 Analyse ved hjælp af generelle lineære modeller De kategoriske variable Between-Subjects Factors Køn Kan man gøre noget selv for at bevare et godt helbred? ryger3 fysisk aktivitet i fritid aktarb ,0 2,0 3,0 3,00 4,00 5,00 2,00 3,00 4,00 2,00 3,00 4,00 Value Label N Mand 1024 Kvinde 1167 egen indsats vigtig 1862 egen indsats af nogen betydning 313 tro ikke på egen indsats 16 ja 999 tidligere 363 aldrig 829 meget/noget aktiv 449 lidt aktiv 1457 ikke aktiv 285 meget/noget aktiv 550 lidt aktiv 547 ikke aktiv

25 Analysestrategier 1. Baglæns trinvis modelsøgning uden vekselvirkninger 2. Inklusion af vekselvirkninger enten en ad gangen eller trinvis med alle vekselvirkninger af en bestemt orden inde 1. Baglæns modelsøgning med alle vekselvirkninger af en vis orden. Husk det hierarkiske princip. 2. Afprøvning af faktorer, der blev elimineret i starten for at være sikker på, at der ikke skete nogle fejl i begyndelsen. 25

26 Analyse ved hjælp af generelle lineære modeller i SPSS Analyze -> General linear models Univariate Kategoriske variable i feltet Fixed factors Kvantitative variable i feltet Covariate(s) 26

27 Definition af modellen Overfør variable fra venstre til højre felt som enten main effects eller Interactions Model ledene kan flyttes tilbage, hvis modellen skal forenkles 27

28 Options Tilvælg: Descriptive statistics Parameter estimates Homogenitets test Spread versus level plots 28

29 Analyse uden vekselvirkninger Dependent Variable: lnbmi Source Corrected Model Intercept køn loc ryger3 aktfrit3 aktarb3 alder aldersqr aldercub Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 7,320 a 12,610 32,688,000 57, , ,908,000 2, , ,975,000,019 2,009,502,605,577 2,289 15,465,000,081 2,040 2,163,115,134 2,067 3,583,028,003 1,003,162,687,072 1,072 3,869,049,158 1,158 8,441,004 40, , , , a. R Squared =,153 (Adjusted R Squared =,148) Kontrol over veget helbred uden betydning. (Fjernes) Alder 3 har stærkt signifikant betydning Aktivitet i fritiden har ikke signifikant betydning Levene's Test of Equality of Error Variances a Dependent Variable: lnbmi F df1 df2 Sig. 1, ,000 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+køn+loc+ryger3+aktfrit3+aktarb3 +alder+aldersqr+aldercub Variansheterogenitet 29

30 Analyse uden kontrol over eget helbred Dependent Variable: lnbmi Source Corrected Model Intercept køn ryger3 aktfrit3 aktarb3 alder aldersqr aldercub Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 7,418 a 10,742 39,258,000 61, , ,544,000 2, , ,135,000,570 2,285 15,095,000,093 2,047 2,463,085,160 2,080 4,237,015,009 1,009,491,484,097 1,097 5,140,023,194 1,194 10,266,001 41, , , , a. R Squared =,152 (Adjusted R Squared =,148) Fysisk aktivitet i fritiden stadig ikke signifikant. Fjernes! Levene's Test of Equality of Error Variances a Dependent Variable: lnbmi F df1 df2 Sig. 2, ,000 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+køn+ryger3+aktfrit3+aktarb3+al der+aldersqr+aldercub Heterogene varianser. Se, hvad der sker, når fritidsaktiviteterne fjernes. 30

31 Analyse uden fysisk aktivitet i fritiden Dependent Variable: lnbmi Source Corrected Model Intercept køn ryger3 aktarb3 alder aldersqr aldercub Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 7,284 a 8,910 48,033,000 62, , ,263,000 2, , ,941,000,587 2,293 15,471,000,126 2,063 3,320,036,005 1,005,240,624,081 1,081 4,255,039,170 1,170 8,969,003 41, , , , a. R Squared =,148 (Adjusted R Squared =,145) Alt er signifikant Levene's Test of Equality of Error Variances a Dependent Variable: lnbmi F df1 df2 Sig. 2, ,001 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+køn+ryger3+aktarb3+alder+alde rsqr+aldercub Stadig heterogene varianser 31

32 Spread versus Level Spread vs. Level Plot of lnbmi 0,17 Spread (Standard Deviation) 0,16 0,15 0,14 0,13 0,12 3,10 3,15 3,20 3,25 Level (Mean) Groups: køn * ryger3 * aktarb3 Varianserne er mindst der hvor ln(bmi) værdien forventes at være høj. Kan det skyldes, at det var en dårlig ide at bruge logaritmen til BMI? 32

33 Analyse med BMI i stedet for logaritmen til BMI Levene's Test of Equality of Error Variances a Dependent Variable: bmi F df1 df2 Sig. 1, ,042 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+køn+ryger3+aktarb3+alder+alde rsqr+aldercub Kun svag evidens mod varianshomogenitet! Variansheterogeniteten i de ensidede variansanalyser ser altså ud til at være konsekvenser af konfounding. 33

34 Test af faktorernes betydning Dependent Variable: bmi Source Corrected Model Intercept køn ryger3 aktarb3 alder aldersqr aldercub Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 4188,444 a 8 523,556 44,618, , , ,839, , ,936 99,533, , ,325 14,430,000 65, ,906 2,804,061 8, ,208,699,403 67, ,993 5,794, , ,887 11,069, , , , , a. R Squared =,139 (Adjusted R Squared =,136) Fysisk aktivitet uden betydning. Den fjernes. 34

35 Analyse uden fysisk aktivitet i arbejdet Heterogene varianser Levene's Test of Equality of Error Variances a Dependent Variable: bmi F df1 df2 Sig. 5, ,000 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+køn+ryger3+alder+aldersqr+aldercub Tilbage til modellen med fysisk aktivitet 35

36 Parameterestimater: Dependent Variable: bmi Parameter Intercept [køn=1] [køn=2] [ryger3=3,00] [ryger3=4,00] [ryger3=5,00] [aktarb3=2,00] [aktarb3=3,00] [aktarb3=4,00] alder aldersqr aldercub Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound 21,568 1,333 16,180,000 18,954 24,182 1,468,147 9,977,000 1,179 1,757 0 a ,606,163-3,726,000 -,925 -,287,433,221 1,957,050 -,001,867 0 a.....,422,179 2,361,018,071,772,172,181,950,342 -,183,528 0 a ,079,094 -,836,403 -,263,106,00485, ,407,016,001,009 -,00004, ,327,001-7,01E-005-1,81E-005 a. This parameter is set to zero because it is redundant. Mænds BMI er 1,5 point større end kvinders. Rygere har -0.6 point mindre og tidligere rygere 0.4 point mere end aldrig rygere. Personer, der er fysisk aktive på deres arbejde, har 0.4 point mere end personer, der slet ikke er fysisk aktive. Der er i øvrigt en pæn monoton tendens. Alderseffekt = -0.79Alder Alder Alder 3 36

37 For at afprøve de overraskende resultater vedrørende den fysiske aktivitet afprøves modeller, hvor det antages, at der kan være interaktion mellem den fysiske aktivitet og andre variable: Dependent Variable: bmi Source Corrected Model Intercept køn ryger3 alder aldersqr aldercub aktarb aktfrit3 køn * aktarb køn * aktfrit3 ryger3 * aktarb ryger3 * aktfrit3 aktarb * aktfrit3 aktarb * alder aktfrit3 * alder aktarb * aldersqr aktfrit3 * aldersqr aktarb * aldercub aktfrit3 * aldercub Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 4966,608 a ,673 9,113, , ,329 52,463, , ,378 37,720, , ,429 9,782,000 5, ,530,477,490,071 1,071,006,938,071 1,071,006,938 36, ,248 1,056,367 42, ,033 1,814,163 29, ,842,849,467 26, ,051 1,126,325 31, ,255,453, , ,363 5,896,000 63, ,542,909,487 35, ,852 1,022,382 40, ,343 1,754,173 34, ,472,989,397 26, ,342 1,151,317 33, ,313,976,403 17, ,670,748, , , , , a. R Squared =,165 (Adjusted R Squared =,147) Bemærk, den højsignifikante interaktion mellem effekten af rygning og effekten af fysisk aktivitet i fritiden! 37

38 Trinvis elimination af ikke signifikante interaktioner: Rygning*fysisk aktivitet i arbejdet ryger først Dependent Variable: bmi Source Corrected Model Intercept køn ryger3 alder aldersqr aldercub aktarb aktfrit3 køn * aktarb køn * aktfrit3 ryger3 * aktfrit3 aktarb * aktfrit3 aktarb * alder aktfrit3 * alder aktarb * aldersqr aktfrit3 * aldersqr aktarb * aldercub aktfrit3 * aldercub Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 4935,077 a ,368 10,396, , ,662 53,263, , ,536 38,136, , ,134 21,518,000 5, ,543,479,489,112 1,112,010,922,021 1,021,002,966 39, ,113 1,133,335 43, ,501 1,857,156 30, ,246,885,448 26, ,257 1,145, , ,730 6,195,000 61, ,195,881,508 36, ,324 1,064,363 42, ,045 1,818,163 35, ,948 1,032,377 27, ,758 1,188,305 35, ,989 1,036,376 17, ,691,751, , , , , a. R Squared =,164 (Adjusted R Squared =,149) Ud med aktarb3*aktfrit3 38

39 Slutmodellen Dependent Variable: bmi Source Corrected Model Intercept køn ryger3 alder aldersqr aldercub aktfrit3 ryger3 * aktfrit3 aktfrit3 * alder aktfrit3 * aldersqr aktarb3 Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 4678,696 a ,928 22,459, , , ,058, , ,068 90,559, , ,633 21,829,000,799 1,799,069,793 39, ,511 3,414,065 87, ,245 7,538,006 42, ,469 1,855, , ,436 6,605,000 83, ,588 3,593,028 84, ,139 3,641,026 81, ,928 3,536, , , , , a. R Squared =,156 (Adjusted R Squared =,149) En kompliceret slutmodel: Signifikant effekt af fysisk aktivitet på arbejdet. Interaktion mellem effekten af fysisk aktivitet i fritiden og både rygevaner og alder. 39

40 Parameter estimater Dependent Variable: bmi Parameter Intercept [køn=1] [køn=2] [ryger3=3,00] [ryger3=4,00] [ryger3=5,00] alder aldersqr aldercub [aktfrit3=2,00] [aktfrit3=3,00] [aktfrit3=4,00] [ryger3=3,00] * [aktfrit3=2,00] [ryger3=3,00] * [aktfrit3=3,00] [ryger3=3,00] * [aktfrit3=4,00] [ryger3=4,00] * [aktfrit3=2,00] [ryger3=4,00] * [aktfrit3=3,00] [ryger3=4,00] * [aktfrit3=4,00] [ryger3=5,00] * [aktfrit3=2,00] [ryger3=5,00] * [aktfrit3=3,00] [ryger3=5,00] * [aktfrit3=4,00] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound 19,136 2,177 8,789,000 14,866 23,406 1,437,151 9,516,000 1,141 1,734 0 a ,453,458-5,352,000-3,352-1,554,709,602 1,178,239 -,471 1,888 0 a.....,108,129,839,402 -,144,360,003,002 1,109,268 -,002,007-4,0E-005,000-2,746,006-6,78E-005-1,13E-005 3,176 2,123 1,496,135 -,986 7,339 2,284 1,585 1,441,150 -,825 5,393 0 a ,062,581 3,551,000,923 3,202 2,132,500 4,267,000 1,152 3,112 0 a ,443,773 -,573,567-1,959 1,073 -,311,660 -,472,637-1,605,983 0 a a a a..... [aktfrit3=2,00] * alder -,227,104-2,177,030 -,432 -,023 [aktfrit3=3,00] * alder -,177,069-2,541,011 -,313 -,040 [aktfrit3=4,00] * alder 0 a..... [aktfrit3=2,00] * aldersqr,002,001 1,989,047 3,31E-005,005 [aktfrit3=3,00] * aldersqr,002,001 2,568,010,000,003 [aktfrit3=4,00] * aldersqr 0 a..... [aktarb3=2,00],476,180 2,643,008,123,829 [aktarb3=3,00],211,183 1,154,249 -,147,569 [aktarb3=4,00] 0 a..... a. This parameter is set to zero because it is redundant. 40

41 Tolkning af parameterestimater Køn: 1.4 point til mændene Fysisk aktivitet i arbejdet: Monoton tendens. Personer med megen fysisk aktivitet har 0.5 BMI point end personer uden fysisk aktivitet. Effekten af alder og rygning påvirkes af fysisk aktivitet i fritiden. 41

42 Effekt af rygning og fritidsaktiviteter Parametre Ryger: Ryger Tidligere Adrig Fritid Hovedvirkning Meget aktiv Aktiv Inaktiv Samlet effekt Ryger: Ryger Tidligere Adrig Fritid Meget aktiv Aktiv Inaktiv

43 Alderseffekten modificeres af fritidsaktiviteten Effekten i reference kategorien er bestemt ved hovedvirkningen: 0.108*Alder *Alder *Alder 3 Effekten blandt dem der er meget aktive: ( )*Alder + ( )*Alder *Alder 3 Fysisk aktiv i fritiden Meget aktiv Noget aktiv Inaktiv Alderseffekt *Alder *Alder *Alder *Alder *Alder *Alder *Alder *Alder *Alder 3 43

44 Alder Mean effekt1 noget aktive inaktive 44

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

KA 4.2 Kvantitative Forskningsmetoder Forår 2010 KA 4.2 Kvantitative Forskningsmetoder Forår 2010 Besvar alle spørgsmål. Brug ikke mere end én side af tekst på de åbne spørgsmål som er markeret * Answer all questions. Do not write more than one page

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

3. SPSS Output. Descriptives. [DataSet1] C:\Users\Thomas\Desktop\Eservice_i_produktgruppen_Bekldning.sav

3. SPSS Output. Descriptives. [DataSet1] C:\Users\Thomas\Desktop\Eservice_i_produktgruppen_Bekldning.sav 3. SPSS Output DESCRIPTIVES VARIABLES=DEM DEM5 DEM10 DEM11 /STATISTICS=MEAN STDDEV MIN MAX. Descriptives [DataSet1] C:\Users\Thomas\Desktop\Eservice_i_produktgruppen_Bekldning.sav Descriptive Statistics

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

To-sidet variansanalyse

To-sidet variansanalyse Program 1. To-sidet variansanalyse 2. Hierarkisk princip 3. Tre (og flere) sidet variansanalyse 4. Variansanalyse med blocking 5. Flersidet variansanalyse med tilfældige faktorer 6. En oversigtsslide til

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 26. februar 2018 1 / 28 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Biokemisk

Læs mere

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression Program Indhold af kursus i overskrifter 1. overblik over kursus (opgaver fra sidst samt huspriser som eksempler). 2. p-værdi 3. uformel evaluering 1. sandsynlighedsregning sandsynlighedsfordelinger (normal,

Læs mere

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance Plot af B j + ǫ ij (Y ij µ α i )): Program: res 4 2 0 2 B1 B2 B3 B4 B5 1. vi starter med at gennemgå opgave 3 side 513. 2. nyt: to-sidet variansanalyse 1 2 3 4 5 block σ 2 : within blocks variance σb 2

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere