Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Størrelse: px
Starte visningen fra side:

Download "Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)"

Transkript

1 Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, som har en bestemt egenskab (nemlig, at erstatningskravet > $ 3500). Vi skriver kort, at X B(200, p), og på basis af en observation x = 84 ønsker vi at udtale os om sandsynlighedsparameteren p. Estimation af p: p = x/n = 84/200 = 0.42 Vi skal benytte large sample approksimationen, dvs en approximation, som er egnet for store stikprøver. Approximationen går på at approksimere binomialfordelingen med normalfordelingen. I(p) 0.95 p±z α/2 p(1 p) n = 0.42±z α/2 0.42(1 0.42) 200 = 0.42±0.068 = [ 0.352, ] hvor α = 0.05 og z α/2 = z = 1.96 er værdien i højre hale af N(0, 1) normalfordelingen. > qnorm(0.975) [1] Kun for 6. og 7. ed. af lærerbogen: Opgave 9.1, side 297(7ed) og side 289(6ed) (For 8. ed. se/løs opgave 10.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, som har en bestemt egenskab (nemlig, at erstatningskravet > $ 1200). Vi skriver kort, at X B(200, p), og på basis af en observation x = 84 ønsker vi at udtale os om sandsynlighedsparameteren p. Estimation af p: p = x/n = 84/200 = 0.42 I figuren side 598 (587) kan et 95% konfidensinterval aflæses direkte: Abscisseværdien 0.42 opsøges og over denne værdi aflæses konfidensintervallet på kurverne for 200 på skalaen ude til venstre. Man finder I(p) 0.95 = [ 0.35, 0.49 ] ca Man kan ogå benytte large sample approksimationen, dvs en approximation, som er egnet for store stikprøver. Approximationen går på at approksimere binomialfordelingen med normalfordelingen. 1

2 I(p) 0.95 p±z α/2 p(1 p) n = 0.42±z α/2 0.42(1 0.42) 200 = 0.42±0.068 = [ 0.352, ] hvor α = 0.05 og z α/2 = z = 1.96 er værdien i højre hale af N(0, 1) normalfordelingen: N(0,1 2 ) areal=

3 Opgave 10.2, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.2) Samme problematik, som i opgave 10.1, men nu ønsker vi at vurdere den maksimale estimationsfejl for p baseret på de foreliggende data. Formlen står på side 281, og vi kunne skrive den som: E 1 α = z α/2 p(1 p) hvor konfidensgraden (1 α) er medtaget for at markere, hvor sikker E er. Idet vi erstatter p i formlen med estimatet p Ê 1 α = z α/2 For α = 0.01 er z α/2 = z = og n p(1 p) n > qnorm(0.995) [1] Ê 0.99 = (1 0.42) 200 = Large sample 99% konfidensintervallet for p er så iøvrigt I(p) 0.99 = p ± Ê0.99 = 0.42 ± [ 0.33, 0.51 ] Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensintervallet, jfr opgave Kun for 6. og 7. ed. af lærerbogen: Opgave 9.2, side 297(7ed) og side 289(6ed) (For 8. ed. se/løs opgave 10.2) Samme problematik, som i opgave 9.1, men nu ønsker vi at vurdere den maksimale estimationsfejl for p baseret på de foreliggende data. Formlen står på side 296 (288), og vi kunne skrive den som: p(1 p) E 1 α = z α/2 n hvor konfidensgraden (1 α) er medtaget for at markere, hvor sikker E er. Idet vi erstatter p i formlen med estimatet p 3

4 Ê 1 α = z α/2 For α = 0.01 er z α/2 = z = og p(1 p) n > qnorm(0.995) [1] Ê 0.99 = (1 0.42) 200 = Large sample 99% konfidensintervallet for p er så iøvrigt I(p) 0.99 = p ± Ê0.99 = 0.42 ± [ 0.33, 0.51 ] Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensintervallet, jfr opgave 9.1. Opgave 10.9, side 283 (7ed: 9.10, side 298 og 6ed: 9.10 side 290) Vi har igen en binomialfordeling og den maksimale estimationsfejl p(1 p) E 1 α = z α/2 n Hvis vi ønsker en vis (maksimal) estimationsfejl ved konfidensniveau α, finder vi (ved at isolere n) relationen : n = p(1 p) som er størst mulig for p = 0.5. ( ) 2 zα/2 E 1 α For α = 0.05 er z α/2 = z = Da der er krævet E 1 α = E 0.95 kravet til n som ( ) n 0.5(1 0.5) = , findes Opgave 10.10, side 283 (7ed: opg. 9.11, side 298 og 6ed: side 290) Hvis man tror, at p 0.75, findes i stedet n 0.75(1 0.75) ( ) = Opgave side 290 (6ed og 7ed: 9.19, side 298 4

5 Der er igen tale om binomialfordelingen. Opgaven går ud på først at konstruere et test og derefter undersøge, om de fundne data understøtter H 0 : p = Testet bliver det samme, dvs H 0 : p = 0.30 mod H 1 : p > Stikprøvefunktion Z = X n p 0 np 0 (1 p 0 ) approx N(0, 1) dvs at Z approximativt følger en N(0, 1) fordeling. Testet er ensidet, og vi forkaster H 0 for store værdier af Z, dvs for Z > z α = for α = 0.05 N(0,1 2 ) α= Vi har nu observeret x = 47 for n = 120, og vi vil teste p 0 = Z = (1 0.30) = 2.19 som er beliggende i det kritiske område. Vi forkaster derfor H 0 og antager H 1 : p > I en praktisk situation ville vi nu anføre et skøn og et konfidensinterval for p. Vi ville finde p = 47/120 = og et approximativt tosidet 95% interval ville blive I(p) 0.95 = ± ( ) Intervallet er approximativt, fordi det bygger på normalfordelingstilnærmelsen til binomialfordelingen. 120 Opgave side 291 (7ed: 9.28, side 307 og 6ed: 9.28 side 299) Som opgaven er formuleret, er den et simpelt eksempel på test i en antalstabel. Vi har to binomialfordelte variable, X og Y, med sandsynlighedsparametre p x og p y. Vi ønsker at teste H 0 : p x = p y mod H 1 : p x p y. 5

6 Observerede antal (o ij ) Baseball uds. Underholningsuds. I alt Husket reklame Ikke husket reklame I alt Hvis H 0 er sand, vil vi estimere p ved p = 139/360 = , og så kan vi skønne, hvor mange svar der i middel ville være i de 2 2 kategorier i ovenstående skema Forventede antal (skøn) (e ij ) Baseball uds. Underholningsuds. I alt Husket reklame Ikke husket reklame I alt For eksempel er /360 = = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller 2 2 χ 2 (o ij e ij ) 2 = χ 2 ((2 1)(2 1)) = χ 2 (1) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 1 frihedsgrad. Bidrag til χ 2 -værdi Baseball uds. Underholningsuds. Husket reklame Ikke husket reklame og χ 2 = = , som kræves mindre end χ 2 (1) 0.05 = : > qchisq(0.95,1) [1] χ 2 (1) α= Da χ 2 -værdien ikke ligger i det kritiske område, kan vi ikke på det foreliggende grundlag afvise H 0. Det samme test kunne være opnået ved at benytte den direkte sammenligning mellem to andele generelt ved hjælp af den approximativt normalfordelte størrelse : 6

7 Z = X/n x Y/n y (p x p y ) px (1 p x )/n x + p y (1 p y )/n y hvori vi sætter p x = p y og estimerer det fælles p med p = (X + Y )/(n x + n y ). Derved fås stikprøvestørrelsen (se side 296): Z = X/n x Y/n y p(1 p)(1/n x + 1/n y ) Ønsker man at teste H 0 : p x = p y mod H 1 : p x p y (tosidet test) får man kritisk område, som vist i følgende figur, dvs Z > z = 1.96 : N(0,1 2 ) α/2=0.025 α/2= Dette test er i virkeligheden det samme test, som det viste χ 2 (1)-test, fordi faktisk Z 2 = χ 2 og (z α/2 ) 2 = χ 2 (1) α (f.eks = 3.84). Ønsker man at teste H 0 : p x p y mod H 1 : p x > p y, dvs et ensidet test, får man kritisk område som vist i følgende figur, dvs Z > z 0.05 = : N(0,1 2 ) α= Fordelen ved den sidste formulering er altså, at man kan teste ensidet, hvilket χ 2 (1)- testet ikke umiddelbart kan gøre (man skal ihvertfald lige tænke sig om en ekstra gang). I R > husket=c(64,75) 7

8 > ikkehusket=c(116,105) > chisq.test(data.frame(husket,ikkehusket)) Pearson s Chi-squared test with Yates continuity correction data: data.frame(husket, ikkehusket) X-squared = , df = 1, p-value = Da p-værdien er større end signifikansniveauet 0.05 kan vi ikke afvise H 0 Opgave 10.29, side 291 (7ed: 9.29, side 307 og 6ed: 9.29 side 299) Som opgaven er formuleret, er den, ligesom opgave 10.28, et eksempel på test i en antalstabel, hvor vi nu ønsker at undersøge, om tre binomialfordelinger kan være ens mht. sandsynlighedsparameteren p. Vi har altså tre binomialfordelte variable, X 1, X 2 og X 3, med sandsynlighedsparametre p 1, p 2 og p 3. Vi ønsker at teste H 0 : p 1 = p 2 = p 3 mod H 1 : p erne er ikke ens. Observerede antal (o ij ) Agency 1 Agency 2 Agency 3 I alt For planen Imod I alt Hvis H 0 er sand, vil vi estimere det fælles p ved p = 260/400 = 0.65, og så kan vi skønne, hvor mange svar der i middel ville være i de 2 3 kategorier i ovenstående skema Forventede antal (skøn) (e ij ) Agency 1 Agency 2 Agency 3 I alt For planen Imod I alt For eksempel er /400 = = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 2 3 χ 2 (o ij e ij ) 2 = χ 2 ((2 1)(3 1)) = χ 2 (2) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 2 frihedsgrader. Bidrag til χ 2 -værdi Agency 1 Agency 2 Agency 3 For planen Imod og χ 2 = = , som sammenlignes med den kritiske værdi χ 2 (2) 0.01 = : > qchisq(0.99,2) 8

9 [1] χ 2 (2) Da χ 2 -værdien ligger i det kritiske område (selv ved test på niveau α = 0.01) må vi på det foreliggende grundlag afvise H 0, og i stedet konkludere, at fordelingen på for og imod for de tre Agencies ikke er den samme. Ved test på f.eks niveau α = 0.05 er den kritiske værdi Den fundne χ 2 -værdi er stærkt signifikant - siger man ofte. > foor=c(67,84,109) > imod=c(33,66,41) > chisq.test(data.frame(foor,imod)) Pearson s Chi-squared test data: data.frame(foor, imod) X-squared = , df = 2, p-value = P-værdien er ikke større end 0.01 significanceniveauet s vi kan afvise nulhypotesen. Kun for 6. og 7. ed. af bogen: Opgave 9.39, side 313(7ed) og side 305(6ed) I denne opgave går det igen ud på at sammenligne fordelinger. I dette tilfælde er der to fordelinger, som begge har tre udfald, nemlig Republikaner, Demokrat og Ikke besluttet. De to fordelinger er hhv. To uger før og Fire uger før. Observerede antal (o ij ) To uger Fire uger I alt Republikaner Demokrat Ikke besluttet I alt Ved almindelig forholdstalsregning kan vi estimere, hvor mange svar der i middel ville være i de 3 2 kategorier i ovenstående skema, hvis de tre fordelinger var ens: 9

10 Forventede antal (skøn) (e ij ) To uger Fire uger I alt Republikaner Demokrat Ikke besluttet I alt For eksempel er /400 = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller 3 2 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(2 1)) = χ 2 (2) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 2 frihedsgrader. Bidrag til χ 2 -værdi To uger Fire uger Republikaner Demokrat Ikke besluttet og χ 2 = = , som ved test på niveau α = 0.05 kræves mindre end χ 2 (2) 0.05 = : χ 2 (2) α= Da χ 2 -værdien ikke ligger i det kritiske område, kan vi ikke på det foreliggende grundlag afvise H 0. Det betyder, at opinionen ikke er signifikant ændret fra fire til to uger før det pågældende valg. Man kunne f.eks interessere sig for andelen af samtlige vælgere, som agter at stemme republikansk. Kaldes denne andel p R, kan vi estimere denne ved p R = 170/400 = , og et 95% konfidensinterval for denne størrelse ville blive I(p R ) 0.95 = ± ( )/400 (se side 287). > republikaner=c(79,91) > demokrat=c(84,66) > ikkebesluttet=c(37,43) > chisq.test(data.frame(republikaner,demokrat,ikkebesluttet)) Pearson s Chi-squared test 10

11 data: data.frame(republikaner, demokrat, ikkebesluttet) X-squared = , df = 2, p-value = Vi kan ikke afvise nulhyposeten da er større end signifikansniveauet Opgave 10.40, side 297 (un for 8. ed.) I denne opgave går det ud på at undersøge, hvorledes handicap og arbejdsevne er relaterede til hinanden. Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i te række ved r i og sandsynligheden for, at et emne kategoriseres i den j te søjle ved s j. Sandsynligheden for at et emne på samme tid kategoriseres i i te række og j te søjle kaldes endelig p ij. Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres: H 0 : p ij = r i s j mod H 1 : Alle alternativer Arbejdsevne Observerede antal (o ij ) Over middel Middel Under middel I alt Blind Døv Intet handicap I alt Vi kan estimere r i erne og s j erne: r = 102/331 79/ /331 = og ŝ = 66/ /331 59/331 De skønnede forventede antal i cellerne er e ij = n r i ŝ j. = Ved at regne lidt på det, ser vi, at vi igen ved almindelig forholdstalsregning kan estimere, hvor mange observationer, der i middel ville være i de 3 3 kategorier i ovenstående skema: Arbejdsevne Forventede antal (skøn) (e ij ) Over middel Middel Under middel I alt Blind Døv Intet handicap I alt For eksempel er 331 r 1 ŝ 1 = 331 (102/331) (66/331) = /331 =

12 Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 3 3 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(3 1)) = χ 2 (4) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 4 frihedsgrader. Arbejdsevne Bidrag til χ 2 -værdi Over middel Middel Under middel Blind Døv Intet handicap og χ 2 = = 0.17, som ved test på niveau α = 0.05 kræves mindre end χ 2 (4) 0.05 = for at opretholde H 0. Da χ 2 -værdien (0.17) ligger inden for det kritiske område, kan vi acceptere H 0. I praksis betyder det, at der ikke er forskel p arbejdsevnen afhngigt af handicap. > blind=c(21,64,17) > doev=c(16,49,14) > ikkehandicap=c(29,93,28) > chisq.test(data.frame(blind,doev,ikkehandicap)) Pearson s Chi-squared test data: data.frame(blind, doev, ikkehandicap) X-squared = , df = 4, p-value = Da p-værden er sørre end signifikansniveauet 0.05 kan vi acceptere nulhypotesen. Opgave 10.41, side 297 (7ed: 9.41, side 314 og 6ed: 9.41, side 306) I denne opgave går det ud på at undersøge, om de to kvalitetskriterier Fidelity og Selectivity er relaterede til hinanden. Man kunne forestille sig, at en høj værdi af det ene kriterium ofte var sammenfaldende med en høj værdi af det andet kriterium (positivt sammenfald) eller det modsatte (negativt sammenfald). Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i te række ved r i og sandsynligheden for, at et emne kategoriseres i den j te søjle ved s j. Sandsynligheden for at et emne på samme tid kategoriseres i i te række og j te søjle kaldes endelig p ij. Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres: H 0 : p ij = r i s j mod H 1 : Alle alternativer 12

13 Vi kan estimere r i erne og s j erne: r = Fidelity Observerede antal (o ij ) Lav Middel Høj I alt Lav selectivitet Middel selectivitet Høj selectivitet I alt / /190 28/190 = og ŝ = 52/190 88/190 50/190 De skønnede forventede antal i cellerne er e ij = n r i ŝ j. = Ved at regne lidt på det, ser vi, at vi igen ved almindelig forholdstalsregning kan estimere, hvor mange observationer, der i middel ville være i de 3 3 kategorier i ovenstående skema: Fidelity Forventede antal (skøn) (e ij ) Lav Middel Høj I alt Lav selectivitet Middel selectivitet Høj selectivitet I alt For eksempel er 190 r 1 ŝ 1 = 190 (50/190) (52/190) = 50 52/190 = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 3 3 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(3 1)) = χ 2 (4) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 4 frihedsgrader. Fidelity Bidrag til χ 2 -værdi Lav Middel Høj Lav selectivitet Middel selectivitet Høj selectivitet og χ 2 = = 54.32, som ved test på niveau α = 0.01 kræves mindre end χ 2 (4) 0.01 = for at opretholde H 0. 13

14 χ 2 (4) α=0.05 α= Da χ 2 -værdien (54.32) ligger (langt ude) i det kritiske område, må vi afvise H 0. Den kritiske værdi for test på niveau α = 0.05 er indtegnet for illustrationens skyld. Den fundne χ 2 -værdi er stærkt signifikant, og man må afvise hypotesen om uafhængighed mellem de to kvalitetskriterier. I praksis kunne det betyde, at de to kvalitetsegenskaber Fidelity og Selectivity i en vis udstrækning er knyttet til de samme komponenter i det undersøgte apparat. I eksemplet giver det sig udslag i, at apparater med lav Selectivity gennemgående har højere Fidelity, mens apparater med høj Selectivity gennemgående har lav Fidelity. Man kunne f.eks interessere sig for andelen af samtlige emner, som kategoriseres som (Lav Selectivity, Høj Fidelity). Kaldes denne andel p LH, kan vi estimere denne ved p LH = 32/190 = , og et 95% konfidensinterval for denne størrelse ville blive (se side 287): I(p LH ) 0.95 = ± ( )/190 > lav=c(6,12,32) > middel=c(33,61,18) > hoej=c(13,15,0) > chisq.test(data.frame(lav,middel,hoej)) Pearson s Chi-squared test data: data.frame(lav, middel, hoej) X-squared = , df = 4, p-value = 4.492e-11 Da p-værdien er meget mindre end signifikansniveauet 0.05, kan vi afvise nulhypotesen. Kun for 6. og 7. ed. af lærerbogen: Opgave 9.47, side 315(7ed) og side 307(6ed) 14

15 Denne opgave illustrerer en hyppigt anvendt metode til at undersøge, om en empirisk fordeling kan tænkes at være udfald fra en given type fordeling. Der benyttes et χ 2 -test i en antalstabel. I det givne tilfælde ønsker man at undersøge, om data kan tænkes at være normalfordelte. Først estimeres den normalfordeling, der kan være tale om, idet observationernes gennemsnit og spredning beregnes, dvs (som opgivet i teksten) : µ = x = og σ 2 = s 2 = = For de viste klasser beregnes et skøn over, hvor mange observationer, der gennemsnitligt ville falde i dem, hvis de n observationer stammede fra en normalfordeling med µ og σ 2 som parametre. Observeret antal n 2 = 10 N(18.85, ) x 80 Estimeret antal = I figuren er det sorte areal skønnet antal observationer mellem 8.95 og 12.95, medens kassen angiver, hvor mange, der faktisk blev fundet. Det sorte areal er i vores eksempel: Det vil sige, med n = 80 : n 2 = n P r {8.95 N(18.85, ) 12.95} [ ( ) ( )] n 2 = 80 Φ Φ = Denne beregning er udført i følgende tabel for alle klasserne: Klasse Målt Klasse- Øvre standar- Φ(.) Skønnet Skønnet antal nr. antal: n i grænser diserede (øvre grænse) andel: p i n i = n p i 1 3 ( ) (+ )

16 Klassegrænserne er beregnet med et betydende ciffer mere (0.05) end dataene er målt i. Så er der ikke tvivl om, hvor en observation skal placeres. Øvre standardiserede grænse er (øvre grænse x)/s. F.eks findes i det andet interval ( ) værdien ( )/5.55 = Herfor findes nu Φ(.) = P r {N(0, 1) (øvre grænse x)/s}. F.eks er Φ( 1.063) = Den relative andel af observationerne, som er beliggende i f.eks klasse 2 er derefter p 2 = Φ( 1.063) Φ( 1.784) = = og det skønnede samlede antal er n 2 = 80 p 2 = 8.50 Vi kan nu beregne χ 2 -værdien for forskellen mellem de målte og de estimerede antal: Klasse Målt Skønnet antal χ 2 nr. antal: n i n i = n p i bidrag I alt χ 2 (n i n i ) 2 = i=1 n i Antal frihedsgrader er k 1 r, hvor k er antal klasser og r er antal parametre, vi har estimeret for at finde klassefordelingen. Her er k = 7 klasser, og r = 2 parametre (nemlig µ og σ 2 ). χ 2 (4) α= Den fundne χ 2 (4)-værdi er ikke beliggende i det kritiske område, og der er altså ikke grund til at afvise hypotesen om, at data kan være normalfordelte. Ofte forlanger man, at der i middel skal være mindst ca 5 i alle klasser. Man ser, at det knap gælder i de to yderste klasser. Disse kan da slås sammen med de næstyderste 16

17 Klasse Målt Skønnet antal χ 2 nr. antal: n i n i = n p i bidrag = = = = I alt De sammenlignes med χ 2 (5 3) 0.05 = 5.991, og heller ikke her er der signifikans mod hypotesen om normalfordelte data. Det vil f.eks. være rimeligt at basere videre analyser af data på en antagelse om, at data stammer fra en normalfordeling. Det kan man have glæde af, hvis man f.eks. vil estimere og/eller teste midddelværdi og/eller varians. > maal=c(3,10,14,25,17,9,2) > skoennet=c(2.98,8.50,17.78,22.49,17.34,8.12,2.75) > chisq.test(data.frame(maal,skoennet)) Pearson s Chi-squared test data: data.frame(maal, skoennet) X-squared = 0.871, df = 6, p-value = 0.99 Da p-værdien 0.99 er større end signifikansnivauet 0.05 kan vi ikke afvise hypotesen. Dec04.2 Formlen i kassen side 290 (7ed: 305, 6ed: 298) anvendes med n 1 = n 2 = 50 og x 1 = 26 og x 2 = 12. Og idet z = er det korrekte svar 4. > qnorm(0.995) [1] Dec04.3 Man m bruge formlen i kassen nederst side 282 (7ed: 296, 6ed:288) med z α/2 = 1.96 og derfor er det korrekte svar 2. Dec04.13 Det korrekte svar er 2. (Se øverst side 287 (7ed: ed: 295)) Dec

18 Det korrekte svar er 5. (DF=2) Dec04.23 Ud fra formlen for et konfidensinterval, side 295 (287) kan man finde at og altså dermed at og altså endelig at z α/2 35/170(1 35/170) = ( )/2 170 z α/ = z α/2 = / = Slår man op i normalfordelingstabellen (eller nederste række i t-tabellen) finder man at α/2 = og derfor er det korrekte svar 3. 18

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Løsninger til kapitel 9

Løsninger til kapitel 9 Opgave 9.1 a) test for spredning, ensidet b) test for middelværdi, ensidet c) test for andel, ensidet d) test for to andele, ensidet e) test for spredning, tosidet f) test for middelværdi, ensidet g) test

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Løsninger til kapitel 6

Løsninger til kapitel 6 Opgave 6.1 a) 180 200 P ( X < 180) = Φ = Φ( = 0, 1587 b) 220 200 P ( X > 220) = Φ = Φ(1) = 0, 8413 c) 200 200 P ( X > 200) = 1 X < 200) = 1 Φ = ) = 1 0,5 = 0, 5 d) P ( X = 230) = 0 e) 180 200 P ( X 180)

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

StatDataN: Test af hypotese

StatDataN: Test af hypotese StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere