Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)
|
|
- Valdemar Lauridsen
- 7 år siden
- Visninger:
Transkript
1 Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, som har en bestemt egenskab (nemlig, at erstatningskravet > $ 3500). Vi skriver kort, at X B(200, p), og på basis af en observation x = 84 ønsker vi at udtale os om sandsynlighedsparameteren p. Estimation af p: p = x/n = 84/200 = 0.42 Vi skal benytte large sample approksimationen, dvs en approximation, som er egnet for store stikprøver. Approximationen går på at approksimere binomialfordelingen med normalfordelingen. I(p) 0.95 p±z α/2 p(1 p) n = 0.42±z α/2 0.42(1 0.42) 200 = 0.42±0.068 = [ 0.352, ] hvor α = 0.05 og z α/2 = z = 1.96 er værdien i højre hale af N(0, 1) normalfordelingen. > qnorm(0.975) [1] Kun for 6. og 7. ed. af lærerbogen: Opgave 9.1, side 297(7ed) og side 289(6ed) (For 8. ed. se/løs opgave 10.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt 200, som har en bestemt egenskab (nemlig, at erstatningskravet > $ 1200). Vi skriver kort, at X B(200, p), og på basis af en observation x = 84 ønsker vi at udtale os om sandsynlighedsparameteren p. Estimation af p: p = x/n = 84/200 = 0.42 I figuren side 598 (587) kan et 95% konfidensinterval aflæses direkte: Abscisseværdien 0.42 opsøges og over denne værdi aflæses konfidensintervallet på kurverne for 200 på skalaen ude til venstre. Man finder I(p) 0.95 = [ 0.35, 0.49 ] ca Man kan ogå benytte large sample approksimationen, dvs en approximation, som er egnet for store stikprøver. Approximationen går på at approksimere binomialfordelingen med normalfordelingen. 1
2 I(p) 0.95 p±z α/2 p(1 p) n = 0.42±z α/2 0.42(1 0.42) 200 = 0.42±0.068 = [ 0.352, ] hvor α = 0.05 og z α/2 = z = 1.96 er værdien i højre hale af N(0, 1) normalfordelingen: N(0,1 2 ) areal=
3 Opgave 10.2, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.2) Samme problematik, som i opgave 10.1, men nu ønsker vi at vurdere den maksimale estimationsfejl for p baseret på de foreliggende data. Formlen står på side 281, og vi kunne skrive den som: E 1 α = z α/2 p(1 p) hvor konfidensgraden (1 α) er medtaget for at markere, hvor sikker E er. Idet vi erstatter p i formlen med estimatet p Ê 1 α = z α/2 For α = 0.01 er z α/2 = z = og n p(1 p) n > qnorm(0.995) [1] Ê 0.99 = (1 0.42) 200 = Large sample 99% konfidensintervallet for p er så iøvrigt I(p) 0.99 = p ± Ê0.99 = 0.42 ± [ 0.33, 0.51 ] Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensintervallet, jfr opgave Kun for 6. og 7. ed. af lærerbogen: Opgave 9.2, side 297(7ed) og side 289(6ed) (For 8. ed. se/løs opgave 10.2) Samme problematik, som i opgave 9.1, men nu ønsker vi at vurdere den maksimale estimationsfejl for p baseret på de foreliggende data. Formlen står på side 296 (288), og vi kunne skrive den som: p(1 p) E 1 α = z α/2 n hvor konfidensgraden (1 α) er medtaget for at markere, hvor sikker E er. Idet vi erstatter p i formlen med estimatet p 3
4 Ê 1 α = z α/2 For α = 0.01 er z α/2 = z = og p(1 p) n > qnorm(0.995) [1] Ê 0.99 = (1 0.42) 200 = Large sample 99% konfidensintervallet for p er så iøvrigt I(p) 0.99 = p ± Ê0.99 = 0.42 ± [ 0.33, 0.51 ] Læg iøvrigt mærke til, at 99% konfidensintervallet er bredere end 95% konfidensintervallet, jfr opgave 9.1. Opgave 10.9, side 283 (7ed: 9.10, side 298 og 6ed: 9.10 side 290) Vi har igen en binomialfordeling og den maksimale estimationsfejl p(1 p) E 1 α = z α/2 n Hvis vi ønsker en vis (maksimal) estimationsfejl ved konfidensniveau α, finder vi (ved at isolere n) relationen : n = p(1 p) som er størst mulig for p = 0.5. ( ) 2 zα/2 E 1 α For α = 0.05 er z α/2 = z = Da der er krævet E 1 α = E 0.95 kravet til n som ( ) n 0.5(1 0.5) = , findes Opgave 10.10, side 283 (7ed: opg. 9.11, side 298 og 6ed: side 290) Hvis man tror, at p 0.75, findes i stedet n 0.75(1 0.75) ( ) = Opgave side 290 (6ed og 7ed: 9.19, side 298 4
5 Der er igen tale om binomialfordelingen. Opgaven går ud på først at konstruere et test og derefter undersøge, om de fundne data understøtter H 0 : p = Testet bliver det samme, dvs H 0 : p = 0.30 mod H 1 : p > Stikprøvefunktion Z = X n p 0 np 0 (1 p 0 ) approx N(0, 1) dvs at Z approximativt følger en N(0, 1) fordeling. Testet er ensidet, og vi forkaster H 0 for store værdier af Z, dvs for Z > z α = for α = 0.05 N(0,1 2 ) α= Vi har nu observeret x = 47 for n = 120, og vi vil teste p 0 = Z = (1 0.30) = 2.19 som er beliggende i det kritiske område. Vi forkaster derfor H 0 og antager H 1 : p > I en praktisk situation ville vi nu anføre et skøn og et konfidensinterval for p. Vi ville finde p = 47/120 = og et approximativt tosidet 95% interval ville blive I(p) 0.95 = ± ( ) Intervallet er approximativt, fordi det bygger på normalfordelingstilnærmelsen til binomialfordelingen. 120 Opgave side 291 (7ed: 9.28, side 307 og 6ed: 9.28 side 299) Som opgaven er formuleret, er den et simpelt eksempel på test i en antalstabel. Vi har to binomialfordelte variable, X og Y, med sandsynlighedsparametre p x og p y. Vi ønsker at teste H 0 : p x = p y mod H 1 : p x p y. 5
6 Observerede antal (o ij ) Baseball uds. Underholningsuds. I alt Husket reklame Ikke husket reklame I alt Hvis H 0 er sand, vil vi estimere p ved p = 139/360 = , og så kan vi skønne, hvor mange svar der i middel ville være i de 2 2 kategorier i ovenstående skema Forventede antal (skøn) (e ij ) Baseball uds. Underholningsuds. I alt Husket reklame Ikke husket reklame I alt For eksempel er /360 = = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller 2 2 χ 2 (o ij e ij ) 2 = χ 2 ((2 1)(2 1)) = χ 2 (1) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 1 frihedsgrad. Bidrag til χ 2 -værdi Baseball uds. Underholningsuds. Husket reklame Ikke husket reklame og χ 2 = = , som kræves mindre end χ 2 (1) 0.05 = : > qchisq(0.95,1) [1] χ 2 (1) α= Da χ 2 -værdien ikke ligger i det kritiske område, kan vi ikke på det foreliggende grundlag afvise H 0. Det samme test kunne være opnået ved at benytte den direkte sammenligning mellem to andele generelt ved hjælp af den approximativt normalfordelte størrelse : 6
7 Z = X/n x Y/n y (p x p y ) px (1 p x )/n x + p y (1 p y )/n y hvori vi sætter p x = p y og estimerer det fælles p med p = (X + Y )/(n x + n y ). Derved fås stikprøvestørrelsen (se side 296): Z = X/n x Y/n y p(1 p)(1/n x + 1/n y ) Ønsker man at teste H 0 : p x = p y mod H 1 : p x p y (tosidet test) får man kritisk område, som vist i følgende figur, dvs Z > z = 1.96 : N(0,1 2 ) α/2=0.025 α/2= Dette test er i virkeligheden det samme test, som det viste χ 2 (1)-test, fordi faktisk Z 2 = χ 2 og (z α/2 ) 2 = χ 2 (1) α (f.eks = 3.84). Ønsker man at teste H 0 : p x p y mod H 1 : p x > p y, dvs et ensidet test, får man kritisk område som vist i følgende figur, dvs Z > z 0.05 = : N(0,1 2 ) α= Fordelen ved den sidste formulering er altså, at man kan teste ensidet, hvilket χ 2 (1)- testet ikke umiddelbart kan gøre (man skal ihvertfald lige tænke sig om en ekstra gang). I R > husket=c(64,75) 7
8 > ikkehusket=c(116,105) > chisq.test(data.frame(husket,ikkehusket)) Pearson s Chi-squared test with Yates continuity correction data: data.frame(husket, ikkehusket) X-squared = , df = 1, p-value = Da p-værdien er større end signifikansniveauet 0.05 kan vi ikke afvise H 0 Opgave 10.29, side 291 (7ed: 9.29, side 307 og 6ed: 9.29 side 299) Som opgaven er formuleret, er den, ligesom opgave 10.28, et eksempel på test i en antalstabel, hvor vi nu ønsker at undersøge, om tre binomialfordelinger kan være ens mht. sandsynlighedsparameteren p. Vi har altså tre binomialfordelte variable, X 1, X 2 og X 3, med sandsynlighedsparametre p 1, p 2 og p 3. Vi ønsker at teste H 0 : p 1 = p 2 = p 3 mod H 1 : p erne er ikke ens. Observerede antal (o ij ) Agency 1 Agency 2 Agency 3 I alt For planen Imod I alt Hvis H 0 er sand, vil vi estimere det fælles p ved p = 260/400 = 0.65, og så kan vi skønne, hvor mange svar der i middel ville være i de 2 3 kategorier i ovenstående skema Forventede antal (skøn) (e ij ) Agency 1 Agency 2 Agency 3 I alt For planen Imod I alt For eksempel er /400 = = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 2 3 χ 2 (o ij e ij ) 2 = χ 2 ((2 1)(3 1)) = χ 2 (2) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 2 frihedsgrader. Bidrag til χ 2 -værdi Agency 1 Agency 2 Agency 3 For planen Imod og χ 2 = = , som sammenlignes med den kritiske værdi χ 2 (2) 0.01 = : > qchisq(0.99,2) 8
9 [1] χ 2 (2) Da χ 2 -værdien ligger i det kritiske område (selv ved test på niveau α = 0.01) må vi på det foreliggende grundlag afvise H 0, og i stedet konkludere, at fordelingen på for og imod for de tre Agencies ikke er den samme. Ved test på f.eks niveau α = 0.05 er den kritiske værdi Den fundne χ 2 -værdi er stærkt signifikant - siger man ofte. > foor=c(67,84,109) > imod=c(33,66,41) > chisq.test(data.frame(foor,imod)) Pearson s Chi-squared test data: data.frame(foor, imod) X-squared = , df = 2, p-value = P-værdien er ikke større end 0.01 significanceniveauet s vi kan afvise nulhypotesen. Kun for 6. og 7. ed. af bogen: Opgave 9.39, side 313(7ed) og side 305(6ed) I denne opgave går det igen ud på at sammenligne fordelinger. I dette tilfælde er der to fordelinger, som begge har tre udfald, nemlig Republikaner, Demokrat og Ikke besluttet. De to fordelinger er hhv. To uger før og Fire uger før. Observerede antal (o ij ) To uger Fire uger I alt Republikaner Demokrat Ikke besluttet I alt Ved almindelig forholdstalsregning kan vi estimere, hvor mange svar der i middel ville være i de 3 2 kategorier i ovenstående skema, hvis de tre fordelinger var ens: 9
10 Forventede antal (skøn) (e ij ) To uger Fire uger I alt Republikaner Demokrat Ikke besluttet I alt For eksempel er /400 = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller 3 2 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(2 1)) = χ 2 (2) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 2 frihedsgrader. Bidrag til χ 2 -værdi To uger Fire uger Republikaner Demokrat Ikke besluttet og χ 2 = = , som ved test på niveau α = 0.05 kræves mindre end χ 2 (2) 0.05 = : χ 2 (2) α= Da χ 2 -værdien ikke ligger i det kritiske område, kan vi ikke på det foreliggende grundlag afvise H 0. Det betyder, at opinionen ikke er signifikant ændret fra fire til to uger før det pågældende valg. Man kunne f.eks interessere sig for andelen af samtlige vælgere, som agter at stemme republikansk. Kaldes denne andel p R, kan vi estimere denne ved p R = 170/400 = , og et 95% konfidensinterval for denne størrelse ville blive I(p R ) 0.95 = ± ( )/400 (se side 287). > republikaner=c(79,91) > demokrat=c(84,66) > ikkebesluttet=c(37,43) > chisq.test(data.frame(republikaner,demokrat,ikkebesluttet)) Pearson s Chi-squared test 10
11 data: data.frame(republikaner, demokrat, ikkebesluttet) X-squared = , df = 2, p-value = Vi kan ikke afvise nulhyposeten da er større end signifikansniveauet Opgave 10.40, side 297 (un for 8. ed.) I denne opgave går det ud på at undersøge, hvorledes handicap og arbejdsevne er relaterede til hinanden. Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i te række ved r i og sandsynligheden for, at et emne kategoriseres i den j te søjle ved s j. Sandsynligheden for at et emne på samme tid kategoriseres i i te række og j te søjle kaldes endelig p ij. Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres: H 0 : p ij = r i s j mod H 1 : Alle alternativer Arbejdsevne Observerede antal (o ij ) Over middel Middel Under middel I alt Blind Døv Intet handicap I alt Vi kan estimere r i erne og s j erne: r = 102/331 79/ /331 = og ŝ = 66/ /331 59/331 De skønnede forventede antal i cellerne er e ij = n r i ŝ j. = Ved at regne lidt på det, ser vi, at vi igen ved almindelig forholdstalsregning kan estimere, hvor mange observationer, der i middel ville være i de 3 3 kategorier i ovenstående skema: Arbejdsevne Forventede antal (skøn) (e ij ) Over middel Middel Under middel I alt Blind Døv Intet handicap I alt For eksempel er 331 r 1 ŝ 1 = 331 (102/331) (66/331) = /331 =
12 Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 3 3 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(3 1)) = χ 2 (4) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 4 frihedsgrader. Arbejdsevne Bidrag til χ 2 -værdi Over middel Middel Under middel Blind Døv Intet handicap og χ 2 = = 0.17, som ved test på niveau α = 0.05 kræves mindre end χ 2 (4) 0.05 = for at opretholde H 0. Da χ 2 -værdien (0.17) ligger inden for det kritiske område, kan vi acceptere H 0. I praksis betyder det, at der ikke er forskel p arbejdsevnen afhngigt af handicap. > blind=c(21,64,17) > doev=c(16,49,14) > ikkehandicap=c(29,93,28) > chisq.test(data.frame(blind,doev,ikkehandicap)) Pearson s Chi-squared test data: data.frame(blind, doev, ikkehandicap) X-squared = , df = 4, p-value = Da p-værden er sørre end signifikansniveauet 0.05 kan vi acceptere nulhypotesen. Opgave 10.41, side 297 (7ed: 9.41, side 314 og 6ed: 9.41, side 306) I denne opgave går det ud på at undersøge, om de to kvalitetskriterier Fidelity og Selectivity er relaterede til hinanden. Man kunne forestille sig, at en høj værdi af det ene kriterium ofte var sammenfaldende med en høj værdi af det andet kriterium (positivt sammenfald) eller det modsatte (negativt sammenfald). Vi kan kalde sandsynligheden for, at et emne kategoriseres i den i te række ved r i og sandsynligheden for, at et emne kategoriseres i den j te søjle ved s j. Sandsynligheden for at et emne på samme tid kategoriseres i i te række og j te søjle kaldes endelig p ij. Hypotesen om uafhængighed mellem række- og søjleinddelingerne kan nu formuleres: H 0 : p ij = r i s j mod H 1 : Alle alternativer 12
13 Vi kan estimere r i erne og s j erne: r = Fidelity Observerede antal (o ij ) Lav Middel Høj I alt Lav selectivitet Middel selectivitet Høj selectivitet I alt / /190 28/190 = og ŝ = 52/190 88/190 50/190 De skønnede forventede antal i cellerne er e ij = n r i ŝ j. = Ved at regne lidt på det, ser vi, at vi igen ved almindelig forholdstalsregning kan estimere, hvor mange observationer, der i middel ville være i de 3 3 kategorier i ovenstående skema: Fidelity Forventede antal (skøn) (e ij ) Lav Middel Høj I alt Lav selectivitet Middel selectivitet Høj selectivitet I alt For eksempel er 190 r 1 ŝ 1 = 190 (50/190) (52/190) = 50 52/190 = Som stikprøvefunktion kan vi nu beregne χ 2 -værdien for forskellen mellem de to tabeller: 3 3 χ 2 (o ij e ij ) 2 = χ 2 ((3 1)(3 1)) = χ 2 (4) i=1 j=1 e ij dvs, at hvis H 0 er sand, vil χ 2 -værdien følge en χ 2 -fordeling med 4 frihedsgrader. Fidelity Bidrag til χ 2 -værdi Lav Middel Høj Lav selectivitet Middel selectivitet Høj selectivitet og χ 2 = = 54.32, som ved test på niveau α = 0.01 kræves mindre end χ 2 (4) 0.01 = for at opretholde H 0. 13
14 χ 2 (4) α=0.05 α= Da χ 2 -værdien (54.32) ligger (langt ude) i det kritiske område, må vi afvise H 0. Den kritiske værdi for test på niveau α = 0.05 er indtegnet for illustrationens skyld. Den fundne χ 2 -værdi er stærkt signifikant, og man må afvise hypotesen om uafhængighed mellem de to kvalitetskriterier. I praksis kunne det betyde, at de to kvalitetsegenskaber Fidelity og Selectivity i en vis udstrækning er knyttet til de samme komponenter i det undersøgte apparat. I eksemplet giver det sig udslag i, at apparater med lav Selectivity gennemgående har højere Fidelity, mens apparater med høj Selectivity gennemgående har lav Fidelity. Man kunne f.eks interessere sig for andelen af samtlige emner, som kategoriseres som (Lav Selectivity, Høj Fidelity). Kaldes denne andel p LH, kan vi estimere denne ved p LH = 32/190 = , og et 95% konfidensinterval for denne størrelse ville blive (se side 287): I(p LH ) 0.95 = ± ( )/190 > lav=c(6,12,32) > middel=c(33,61,18) > hoej=c(13,15,0) > chisq.test(data.frame(lav,middel,hoej)) Pearson s Chi-squared test data: data.frame(lav, middel, hoej) X-squared = , df = 4, p-value = 4.492e-11 Da p-værdien er meget mindre end signifikansniveauet 0.05, kan vi afvise nulhypotesen. Kun for 6. og 7. ed. af lærerbogen: Opgave 9.47, side 315(7ed) og side 307(6ed) 14
15 Denne opgave illustrerer en hyppigt anvendt metode til at undersøge, om en empirisk fordeling kan tænkes at være udfald fra en given type fordeling. Der benyttes et χ 2 -test i en antalstabel. I det givne tilfælde ønsker man at undersøge, om data kan tænkes at være normalfordelte. Først estimeres den normalfordeling, der kan være tale om, idet observationernes gennemsnit og spredning beregnes, dvs (som opgivet i teksten) : µ = x = og σ 2 = s 2 = = For de viste klasser beregnes et skøn over, hvor mange observationer, der gennemsnitligt ville falde i dem, hvis de n observationer stammede fra en normalfordeling med µ og σ 2 som parametre. Observeret antal n 2 = 10 N(18.85, ) x 80 Estimeret antal = I figuren er det sorte areal skønnet antal observationer mellem 8.95 og 12.95, medens kassen angiver, hvor mange, der faktisk blev fundet. Det sorte areal er i vores eksempel: Det vil sige, med n = 80 : n 2 = n P r {8.95 N(18.85, ) 12.95} [ ( ) ( )] n 2 = 80 Φ Φ = Denne beregning er udført i følgende tabel for alle klasserne: Klasse Målt Klasse- Øvre standar- Φ(.) Skønnet Skønnet antal nr. antal: n i grænser diserede (øvre grænse) andel: p i n i = n p i 1 3 ( ) (+ )
16 Klassegrænserne er beregnet med et betydende ciffer mere (0.05) end dataene er målt i. Så er der ikke tvivl om, hvor en observation skal placeres. Øvre standardiserede grænse er (øvre grænse x)/s. F.eks findes i det andet interval ( ) værdien ( )/5.55 = Herfor findes nu Φ(.) = P r {N(0, 1) (øvre grænse x)/s}. F.eks er Φ( 1.063) = Den relative andel af observationerne, som er beliggende i f.eks klasse 2 er derefter p 2 = Φ( 1.063) Φ( 1.784) = = og det skønnede samlede antal er n 2 = 80 p 2 = 8.50 Vi kan nu beregne χ 2 -værdien for forskellen mellem de målte og de estimerede antal: Klasse Målt Skønnet antal χ 2 nr. antal: n i n i = n p i bidrag I alt χ 2 (n i n i ) 2 = i=1 n i Antal frihedsgrader er k 1 r, hvor k er antal klasser og r er antal parametre, vi har estimeret for at finde klassefordelingen. Her er k = 7 klasser, og r = 2 parametre (nemlig µ og σ 2 ). χ 2 (4) α= Den fundne χ 2 (4)-værdi er ikke beliggende i det kritiske område, og der er altså ikke grund til at afvise hypotesen om, at data kan være normalfordelte. Ofte forlanger man, at der i middel skal være mindst ca 5 i alle klasser. Man ser, at det knap gælder i de to yderste klasser. Disse kan da slås sammen med de næstyderste 16
17 Klasse Målt Skønnet antal χ 2 nr. antal: n i n i = n p i bidrag = = = = I alt De sammenlignes med χ 2 (5 3) 0.05 = 5.991, og heller ikke her er der signifikans mod hypotesen om normalfordelte data. Det vil f.eks. være rimeligt at basere videre analyser af data på en antagelse om, at data stammer fra en normalfordeling. Det kan man have glæde af, hvis man f.eks. vil estimere og/eller teste midddelværdi og/eller varians. > maal=c(3,10,14,25,17,9,2) > skoennet=c(2.98,8.50,17.78,22.49,17.34,8.12,2.75) > chisq.test(data.frame(maal,skoennet)) Pearson s Chi-squared test data: data.frame(maal, skoennet) X-squared = 0.871, df = 6, p-value = 0.99 Da p-værdien 0.99 er større end signifikansnivauet 0.05 kan vi ikke afvise hypotesen. Dec04.2 Formlen i kassen side 290 (7ed: 305, 6ed: 298) anvendes med n 1 = n 2 = 50 og x 1 = 26 og x 2 = 12. Og idet z = er det korrekte svar 4. > qnorm(0.995) [1] Dec04.3 Man m bruge formlen i kassen nederst side 282 (7ed: 296, 6ed:288) med z α/2 = 1.96 og derfor er det korrekte svar 2. Dec04.13 Det korrekte svar er 2. (Se øverst side 287 (7ed: ed: 295)) Dec
18 Det korrekte svar er 5. (DF=2) Dec04.23 Ud fra formlen for et konfidensinterval, side 295 (287) kan man finde at og altså dermed at og altså endelig at z α/2 35/170(1 35/170) = ( )/2 170 z α/ = z α/2 = / = Slår man op i normalfordelingstabellen (eller nederste række i t-tabellen) finder man at α/2 = og derfor er det korrekte svar 3. 18
Besvarelser til øvelsesopgaver i uge 6
Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mere02402 Vejledende løsninger til Splus-opgaverne fra hele kurset
02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også
Læs mereNanostatistik: Opgavebesvarelser
Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,
Læs mereNote til styrkefunktionen
Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereKursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Læs mereVejledende løsninger kapitel 8 opgaver
KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereKapitel 7 Forskelle mellem centraltendenser
Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereVejledende besvarelse af eksamen i Statistik for biokemikere, blok
Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder
Læs mereOpgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)
Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mere02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5
02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereSupplement til kapitel 7: Approksimationen til normalfordelingen, s. 136
Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereOm hypoteseprøvning (1)
E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereTeoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Læs mereC) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.
C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011
Læs mereIntroduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher
Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mereIntroduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher
Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår
Læs mereSide 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Læs mere2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.
2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereLøsninger til kapitel 9
Opgave 9.1 a) test for spredning, ensidet b) test for middelværdi, ensidet c) test for andel, ensidet d) test for to andele, ensidet e) test for spredning, tosidet f) test for middelværdi, ensidet g) test
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereOvenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereDefinition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereBasal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereBinomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1 Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereOpgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Læs mereChi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mere02402 Løsning til testquiz02402f (Test VI)
02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereForelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereLars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Læs meret-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereLandmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:
Læs mereRepetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereSchweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.
Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske
Læs mereLøsninger til kapitel 6
Opgave 6.1 a) 180 200 P ( X < 180) = Φ = Φ( = 0, 1587 b) 220 200 P ( X > 220) = Φ = Φ(1) = 0, 8413 c) 200 200 P ( X > 200) = 1 X < 200) = 1 Φ = ) = 1 0,5 = 0, 5 d) P ( X = 230) = 0 e) 180 200 P ( X 180)
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereNote om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Læs mere2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter
Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen
Læs mereKvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder
Læs mereStatistik i basketball
En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereStatDataN: Test af hypotese
StatDataN: Test af hypotese JLJ StatDataN: Test af hypotese p. 1/69 Repetition n uafhængige gentagne målinger: Fordelingsundersøgelse: Pindediagram / Histogram qq-plot Parameter: egenskab ved fordeling
Læs mereBinomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.
Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):
Læs mereKonfidensinterval for µ (σ kendt)
Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mere