Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Transkript

1 Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, som har en bestemt egenskab (nemlig, at erstatningskravet > $ 3500). Vi skriver kort, at X B(200, p), og på basis af en observation x = 84 ønsker vi at udtale os om sandsynlighedsparameteren p. Estimation af p: p = x/n = 84/200 = 0.42 Vi skal benytte large sample approksimationen, dvs en approximation, som er egnet for store stikprøver. Approximationen går på at approksimere binomialfordelingen med normalfordelingen. I(p) 0.95 p±z α/2 p(1 p) n = 0.42±z α/2 0.42(1 0.42) 200 = 0.42±0.068 = [ 0.352, ] hvor α = 0.05 og z α/2 = z = 1.96 er værdien i højre hale af N(0, 1) normalfordelingen. > qnorm(0.975) [1] Kun for 6. og 7. ed. af lærerbogen: Opgave 9.1, side 297(7ed) og side 289(6ed) (For 8. ed. se/løs opgave 10.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, som har en bestemt egenskab (nemlig, at erstatningskravet > $ 1200). Vi skriver kort, at X B(200, p), og på basis af en observation x = 84 ønsker vi at udtale os om sandsynlighedsparameteren p. Estimation af p: p = x/n = 84/200 = 0.42 I figuren side 598 (587) kan et 95% konfidensinterval aflæses direkte: Abscisseværdien 0.42 opsøges og over denne værdi aflæses konfidensintervallet på kurverne for 200 på skalaen ude til venstre. Man finder I(p) 0.95 = [ 0.35, 0.49 ] ca Man kan ogå benytte large sample approksimationen, dvs en approximation, som er egnet for store stikprøver. Approximationen går på at approksimere binomialfordelingen med normalfordelingen. 1

2 I(p) 0.95 p±z α/2 p(1 p) n = 0.42±z α/2 0.42(1 0.42) 200 = 0.42±0.068 = [ 0.352, ] hvor α = 0.05 og z α/2 = z = 1.96 er værdien i højre hale af N(0, 1) normalfordelingen: N(0,1 2 ) areal=

3 Opgave 10.2, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.2) Samme problematik, som i opgave 10.1, men nu ønsker vi at vurdere den maksimale estimationsfejl for p baseret på de foreliggende data. Formlen står på side 281, og vi kunne skrive den som: E 1 α = z α/2 p(1 p) hvor konfidensgraden (1 α) er medtaget for at markere, hvor sikker E er. Idet vi erstatter p i formlen med estimatet p Ê 1 α = z α/2 For α = 0.01 er z α/2 = z = og n p(1 p) n > qnorm(0.995) [1] Ê 0.99 = (1 0.42) 200 = Large sample 99% konfidensintervallet for p er så iøvrigt I(p) 0.99 = p ± Ê0.99 = 0.42 ± [ 0.33, 0.51 ] Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensintervallet, jfr opgave Kun for 6. og 7. ed. af lærerbogen: Opgave 9.2, side 297(7ed) og side 289(6ed) (For 8. ed. se/løs opgave 10.2) Samme problematik, som i opgave 9.1, men nu ønsker vi at vurdere den maksimale estimationsfejl for p baseret på de foreliggende data. Formlen står på side 296 (288), og vi kunne skrive den som: p(1 p) E 1 α = z α/2 n hvor konfidensgraden (1 α) er medtaget for at markere, hvor sikker E er. Idet vi erstatter p i formlen med estimatet p 3

4 Ê 1 α = z α/2 For α = 0.01 er z α/2 = z = og p(1 p) n > qnorm(0.995) [1] Ê 0.99 = (1 0.42) 200 = Large sample 99% konfidensintervallet for p er så iøvrigt I(p) 0.99 = p ± Ê0.99 = 0.42 ± [ 0.33, 0.51 ] Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensintervallet, jfr opgave 9.1. Opgave 10.9, side 283 (7ed: 9.10, side 298 og 6ed: 9.10 side 290) Vi har igen en binomialfordeling og den maksimale estimationsfejl p(1 p) E 1 α = z α/2 n Hvis vi ønsker en vis (maksimal) estimationsfejl ved konfidensniveau α, finder vi (ved at isolere n) relationen : n = p(1 p) som er størst mulig for p = 0.5. ( ) 2 zα/2 E 1 α For α = 0.05 er z α/2 = z = Da der er krævet E 1 α = E 0.95 kravet til n som ( ) n 0.5(1 0.5) = , findes Opgave 10.10, side 283 (7ed: opg. 9.11, side 298 og 6ed: side 290) Hvis man tror, at p 0.75, findes i stedet n 0.75(1 0.75) ( ) = Opgave side 290 (6ed og 7ed: 9.19, side 298 4

5 Der er igen tale om binomialfordelingen. Opgaven går ud på først at konstruere et test og derefter undersøge, om de fundne data understøtter H 0 : p = Testet bliver det samme, dvs H 0 : p = 0.30 mod H 1 : p > Stikprøvefunktion Z = X n p 0 np 0 (1 p 0 ) approx N(0, 1) dvs at Z approximativt følger en N(0, 1) fordeling. Testet er ensidet, og vi forkaster H 0 for store værdier af Z, dvs for Z > z α = for α = 0.05 N(0,1 2 ) α= Vi har nu observeret x = 47 for n = 120, og vi vil teste p 0 = Z = (1 0.30) = 2.19 som er beliggende i det kritiske område. Vi forkaster derfor H 0 og antager H 1 : p > I en praktisk situation ville vi nu anføre et skøn og et konfidensinterval for p. Vi ville finde p = 47/120 = og et approximativt tosidet 95% interval ville blive I(p) 0.95 = ± ( ) Intervallet er approximativt, fordi det bygger på normalfordelingstilnærmelsen til binomialfordelingen. 120 Opgave side 291 (7ed: 9.28, side 307 og 6ed: 9.28 side 299) Som opgaven er formuleret, er den et simpelt eksempel på test i en antalstabel. Vi har to binomialfordelte variable, X og Y, med sandsynlighedsparametre p x og p y. Vi ønsker at teste H 0 : p x = p y mod H 1 : p x p y. 5

6 Observerede antal (o ij ) Baseball uds. Underholningsuds. I alt Husket reklame Ikke husket reklame I alt Hvis H 0 er sand, vil vi estimere p ved p = 139/360 = , og så kan vi skønne, hvor mange svar der i middel ville være i de 2 2 kategorier i ovenstående skema Forventede antal (skøn) (e ij ) Baseball uds. Underholningsuds. I alt Husket reklame Ikke husket reklame I alt For eksempel er /360 = = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller 2 2 χ 2 (o ij e ij ) 2 = χ 2 ((2 1)(2 1)) = χ 2 (1) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 1 frihedsgrad. Bidrag til χ 2 -værdi Baseball uds. Underholningsuds. Husket reklame Ikke husket reklame og χ 2 = = , som kræves mindre end χ 2 (1) 0.05 = : > qchisq(0.95,1) [1] χ 2 (1) α= Da χ 2 -værdien ikke ligger i det kritiske område, kan vi ikke på det foreliggende grundlag afvise H 0. Det samme test kunne være opnået ved at benytte den direkte sammenligning mellem to andele generelt ved hjælp af den approximativt normalfordelte størrelse : 6

7 Z = X/n x Y/n y (p x p y ) px (1 p x )/n x + p y (1 p y )/n y hvori vi sætter p x = p y og estimerer det fælles p med p = (X + Y )/(n x + n y ). Derved fås stikprøvestørrelsen (se side 296): Z = X/n x Y/n y p(1 p)(1/n x + 1/n y ) Ønsker man at teste H 0 : p x = p y mod H 1 : p x p y (tosidet test) får man kritisk område, som vist i følgende figur, dvs Z > z = 1.96 : N(0,1 2 ) α/2=0.025 α/2= Dette test er i virkeligheden det samme test, som det viste χ 2 (1)-test, fordi faktisk Z 2 = χ 2 og (z α/2 ) 2 = χ 2 (1) α (f.eks = 3.84). Ønsker man at teste H 0 : p x p y mod H 1 : p x > p y, dvs et ensidet test, får man kritisk område som vist i følgende figur, dvs Z > z 0.05 = : N(0,1 2 ) α= Fordelen ved den sidste formulering er altså, at man kan teste ensidet, hvilket χ 2 (1)- testet ikke umiddelbart kan gøre (man skal ihvertfald lige tænke sig om en ekstra gang). I R > husket=c(64,75) 7

8 > ikkehusket=c(116,105) > chisq.test(data.frame(husket,ikkehusket)) Pearson s Chi-squared test with Yates continuity correction data: data.frame(husket, ikkehusket) X-squared = , df = 1, p-value = Da p-værdien er større end signifikansniveauet 0.05 kan vi ikke afvise H 0 Opgave 10.29, side 291 (7ed: 9.29, side 307 og 6ed: 9.29 side 299) Som opgaven er formuleret, er den, ligesom opgave 10.28, et eksempel på test i en antalstabel, hvor vi nu ønsker at undersøge, om tre binomialfordelinger kan være ens mht. sandsynlighedsparameteren p. Vi har altså tre binomialfordelte variable, X 1, X 2 og X 3, med sandsynlighedsparametre p 1, p 2 og p 3. Vi ønsker at teste H 0 : p 1 = p 2 = p 3 mod H 1 : p erne er ikke ens. Observerede antal (o ij ) Agency 1 Agency 2 Agency 3 I alt For planen Imod I alt Hvis H 0 er sand, vil vi estimere det fælles p ved p = 260/400 = 0.65, og så kan vi skønne, hvor mange svar der i middel ville være i de 2 3 kategorier i ovenstående skema Forventede antal (skøn) (e ij ) Agency 1 Agency 2 Agency 3 I alt For planen Imod I alt For eksempel er /400 = = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 2 3 χ 2 (o ij e ij ) 2 = χ 2 ((2 1)(3 1)) = χ 2 (2) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 2 frihedsgrader. Bidrag til χ 2 -værdi Agency 1 Agency 2 Agency 3 For planen Imod og χ 2 = = , som sammenlignes med den kritiske værdi χ 2 (2) 0.01 = : > qchisq(0.99,2) 8

9 [1] χ 2 (2) Da χ 2 -værdien ligger i det kritiske område (selv ved test på niveau α = 0.01) må vi på det foreliggende grundlag afvise H 0, og i stedet konkludere, at fordelingen på for og imod for de tre Agencies ikke er den samme. Ved test på f.eks niveau α = 0.05 er den kritiske værdi Den fundne χ 2 -værdi er stærkt signifikant - siger man ofte. > foor=c(67,84,109) > imod=c(33,66,41) > chisq.test(data.frame(foor,imod)) Pearson s Chi-squared test data: data.frame(foor, imod) X-squared = , df = 2, p-value = P-værdien er ikke større end 0.01 significanceniveauet s vi kan afvise nulhypotesen. Kun for 6. og 7. ed. af bogen: Opgave 9.39, side 313(7ed) og side 305(6ed) I denne opgave går det igen ud på at sammenligne fordelinger. I dette tilfælde er der to fordelinger, som begge har tre udfald, nemlig Republikaner, Demokrat og Ikke besluttet. De to fordelinger er hhv. To uger før og Fire uger før. Observerede antal (o ij ) To uger Fire uger I alt Republikaner Demokrat Ikke besluttet I alt Ved almindelig forholdstalsregning kan vi estimere, hvor mange svar der i middel ville være i de 3 2 kategorier i ovenstående skema, hvis de tre fordelinger var ens: 9

10 Forventede antal (skøn) (e ij ) To uger Fire uger I alt Republikaner Demokrat Ikke besluttet I alt For eksempel er /400 = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller 3 2 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(2 1)) = χ 2 (2) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 2 frihedsgrader. Bidrag til χ 2 -værdi To uger Fire uger Republikaner Demokrat Ikke besluttet og χ 2 = = , som ved test på niveau α = 0.05 kræves mindre end χ 2 (2) 0.05 = : χ 2 (2) α= Da χ 2 -værdien ikke ligger i det kritiske område, kan vi ikke på det foreliggende grundlag afvise H 0. Det betyder, at opinionen ikke er signifikant ændret fra fire til to uger før det pågældende valg. Man kunne f.eks interessere sig for andelen af samtlige vælgere, som agter at stemme republikansk. Kaldes denne andel p R, kan vi estimere denne ved p R = 170/400 = , og et 95% konfidensinterval for denne størrelse ville blive I(p R ) 0.95 = ± ( )/400 (se side 287). > republikaner=c(79,91) > demokrat=c(84,66) > ikkebesluttet=c(37,43) > chisq.test(data.frame(republikaner,demokrat,ikkebesluttet)) Pearson s Chi-squared test 10

11 data: data.frame(republikaner, demokrat, ikkebesluttet) X-squared = , df = 2, p-value = Vi kan ikke afvise nulhyposeten da er større end signifikansniveauet Opgave 10.40, side 297 (un for 8. ed.) I denne opgave går det ud på at undersøge, hvorledes handicap og arbejdsevne er relaterede til hinanden. Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i te række ved r i og sandsynligheden for, at et emne kategoriseres i den j te søjle ved s j. Sandsynligheden for at et emne på samme tid kategoriseres i i te række og j te søjle kaldes endelig p ij. Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres: H 0 : p ij = r i s j mod H 1 : Alle alternativer Arbejdsevne Observerede antal (o ij ) Over middel Middel Under middel I alt Blind Døv Intet handicap I alt Vi kan estimere r i erne og s j erne: r = 102/331 79/ /331 = og ŝ = 66/ /331 59/331 De skønnede forventede antal i cellerne er e ij = n r i ŝ j. = Ved at regne lidt på det, ser vi, at vi igen ved almindelig forholdstalsregning kan estimere, hvor mange observationer, der i middel ville være i de 3 3 kategorier i ovenstående skema: Arbejdsevne Forventede antal (skøn) (e ij ) Over middel Middel Under middel I alt Blind Døv Intet handicap I alt For eksempel er 331 r 1 ŝ 1 = 331 (102/331) (66/331) = /331 =

12 Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 3 3 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(3 1)) = χ 2 (4) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 4 frihedsgrader. Arbejdsevne Bidrag til χ 2 -værdi Over middel Middel Under middel Blind Døv Intet handicap og χ 2 = = 0.17, som ved test på niveau α = 0.05 kræves mindre end χ 2 (4) 0.05 = for at opretholde H 0. Da χ 2 -værdien (0.17) ligger inden for det kritiske område, kan vi acceptere H 0. I praksis betyder det, at der ikke er forskel p arbejdsevnen afhngigt af handicap. > blind=c(21,64,17) > doev=c(16,49,14) > ikkehandicap=c(29,93,28) > chisq.test(data.frame(blind,doev,ikkehandicap)) Pearson s Chi-squared test data: data.frame(blind, doev, ikkehandicap) X-squared = , df = 4, p-value = Da p-værden er sørre end signifikansniveauet 0.05 kan vi acceptere nulhypotesen. Opgave 10.41, side 297 (7ed: 9.41, side 314 og 6ed: 9.41, side 306) I denne opgave går det ud på at undersøge, om de to kvalitetskriterier Fidelity og Selectivity er relaterede til hinanden. Man kunne forestille sig, at en høj værdi af det ene kriterium ofte var sammenfaldende med en høj værdi af det andet kriterium (positivt sammenfald) eller det modsatte (negativt sammenfald). Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i te række ved r i og sandsynligheden for, at et emne kategoriseres i den j te søjle ved s j. Sandsynligheden for at et emne på samme tid kategoriseres i i te række og j te søjle kaldes endelig p ij. Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres: H 0 : p ij = r i s j mod H 1 : Alle alternativer 12

13 Vi kan estimere r i erne og s j erne: r = Fidelity Observerede antal (o ij ) Lav Middel Høj I alt Lav selectivitet Middel selectivitet Høj selectivitet I alt / /190 28/190 = og ŝ = 52/190 88/190 50/190 De skønnede forventede antal i cellerne er e ij = n r i ŝ j. = Ved at regne lidt på det, ser vi, at vi igen ved almindelig forholdstalsregning kan estimere, hvor mange observationer, der i middel ville være i de 3 3 kategorier i ovenstående skema: Fidelity Forventede antal (skøn) (e ij ) Lav Middel Høj I alt Lav selectivitet Middel selectivitet Høj selectivitet I alt For eksempel er 190 r 1 ŝ 1 = 190 (50/190) (52/190) = 50 52/190 = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 3 3 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(3 1)) = χ 2 (4) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 4 frihedsgrader. Fidelity Bidrag til χ 2 -værdi Lav Middel Høj Lav selectivitet Middel selectivitet Høj selectivitet og χ 2 = = 54.32, som ved test på niveau α = 0.01 kræves mindre end χ 2 (4) 0.01 = for at opretholde H 0. 13

14 χ 2 (4) α=0.05 α= Da χ 2 -værdien (54.32) ligger (langt ude) i det kritiske område, må vi afvise H 0. Den kritiske værdi for test på niveau α = 0.05 er indtegnet for illustrationens skyld. Den fundne χ 2 -værdi er stærkt signifikant, og man må afvise hypotesen om uafhængighed mellem de to kvalitetskriterier. I praksis kunne det betyde, at de to kvalitetsegenskaber Fidelity og Selectivity i en vis udstrækning er knyttet til de samme komponenter i det undersøgte apparat. I eksemplet giver det sig udslag i, at apparater med lav Selectivity gennemgående har højere Fidelity, mens apparater med høj Selectivity gennemgående har lav Fidelity. Man kunne f.eks interessere sig for andelen af samtlige emner, som kategoriseres som (Lav Selectivity, Høj Fidelity). Kaldes denne andel p LH, kan vi estimere denne ved p LH = 32/190 = , og et 95% konfidensinterval for denne størrelse ville blive (se side 287): I(p LH ) 0.95 = ± ( )/190 > lav=c(6,12,32) > middel=c(33,61,18) > hoej=c(13,15,0) > chisq.test(data.frame(lav,middel,hoej)) Pearson s Chi-squared test data: data.frame(lav, middel, hoej) X-squared = , df = 4, p-value = 4.492e-11 Da p-værdien er meget mindre end signifikansniveauet 0.05, kan vi afvise nulhypotesen. Kun for 6. og 7. ed. af lærerbogen: Opgave 9.47, side 315(7ed) og side 307(6ed) 14

15 Denne opgave illustrerer en hyppigt anvendt metode til at undersøge, om en empirisk fordeling kan tænkes at være udfald fra en given type fordeling. Der benyttes et χ 2 -test i en antalstabel. I det givne tilfælde ønsker man at undersøge, om data kan tænkes at være normalfordelte. Først estimeres den normalfordeling, der kan være tale om, idet observationernes gennemsnit og spredning beregnes, dvs (som opgivet i teksten) : µ = x = og σ 2 = s 2 = = For de viste klasser beregnes et skøn over, hvor mange observationer, der gennemsnitligt ville falde i dem, hvis de n observationer stammede fra en normalfordeling med µ og σ 2 som parametre. Observeret antal n 2 = 10 N(18.85, ) x 80 Estimeret antal = I figuren er det sorte areal skønnet antal observationer mellem 8.95 og 12.95, medens kassen angiver, hvor mange, der faktisk blev fundet. Det sorte areal er i vores eksempel: Det vil sige, med n = 80 : n 2 = n P r {8.95 N(18.85, ) 12.95} [ ( ) ( )] n 2 = 80 Φ Φ = Denne beregning er udført i følgende tabel for alle klasserne: Klasse Målt Klasse- Øvre standar- Φ(.) Skønnet Skønnet antal nr. antal: n i grænser diserede (øvre grænse) andel: p i n i = n p i 1 3 ( ) (+ )

16 Klassegrænserne er beregnet med et betydende ciffer mere (0.05) end dataene er målt i. Så er der ikke tvivl om, hvor en observation skal placeres. Øvre standardiserede grænse er (øvre grænse x)/s. F.eks findes i det andet interval ( ) værdien ( )/5.55 = Herfor findes nu Φ(.) = P r {N(0, 1) (øvre grænse x)/s}. F.eks er Φ( 1.063) = Den relative andel af observationerne, som er beliggende i f.eks klasse 2 er derefter p 2 = Φ( 1.063) Φ( 1.784) = = og det skønnede samlede antal er n 2 = 80 p 2 = 8.50 Vi kan nu beregne χ 2 -værdien for forskellen mellem de målte og de estimerede antal: Klasse Målt Skønnet antal χ 2 nr. antal: n i n i = n p i bidrag I alt χ 2 (n i n i ) 2 = i=1 n i Antal frihedsgrader er k 1 r, hvor k er antal klasser og r er antal parametre, vi har estimeret for at finde klassefordelingen. Her er k = 7 klasser, og r = 2 parametre (nemlig µ og σ 2 ). χ 2 (4) α= Den fundne χ 2 (4)-værdi er ikke beliggende i det kritiske område, og der er altså ikke grund til at afvise hypotesen om, at data kan være normalfordelte. Ofte forlanger man, at der i middel skal være mindst ca 5 i alle klasser. Man ser, at det knap gælder i de to yderste klasser. Disse kan da slås sammen med de næstyderste 16

17 Klasse Målt Skønnet antal χ 2 nr. antal: n i n i = n p i bidrag = = = = I alt De sammenlignes med χ 2 (5 3) 0.05 = 5.991, og heller ikke her er der signifikans mod hypotesen om normalfordelte data. Det vil f.eks. være rimeligt at basere videre analyser af data på en antagelse om, at data stammer fra en normalfordeling. Det kan man have glæde af, hvis man f.eks. vil estimere og/eller teste midddelværdi og/eller varians. > maal=c(3,10,14,25,17,9,2) > skoennet=c(2.98,8.50,17.78,22.49,17.34,8.12,2.75) > chisq.test(data.frame(maal,skoennet)) Pearson s Chi-squared test data: data.frame(maal, skoennet) X-squared = 0.871, df = 6, p-value = 0.99 Da p-værdien 0.99 er større end signifikansnivauet 0.05 kan vi ikke afvise hypotesen. Dec04.2 Formlen i kassen side 290 (7ed: 305, 6ed: 298) anvendes med n 1 = n 2 = 50 og x 1 = 26 og x 2 = 12. Og idet z = er det korrekte svar 4. > qnorm(0.995) [1] Dec04.3 Man m bruge formlen i kassen nederst side 282 (7ed: 296, 6ed:288) med z α/2 = 1.96 og derfor er det korrekte svar 2. Dec04.13 Det korrekte svar er 2. (Se øverst side 287 (7ed: ed: 295)) Dec

18 Det korrekte svar er 5. (DF=2) Dec04.23 Ud fra formlen for et konfidensinterval, side 295 (287) kan man finde at og altså dermed at og altså endelig at z α/2 35/170(1 35/170) = ( )/2 170 z α/ = z α/2 = / = Slår man op i normalfordelingstabellen (eller nederste række i t-tabellen) finder man at α/2 = og derfor er det korrekte svar 3. 18