NMAA05085U  Statistik 2 (Stat2)

Årgang 2013/2014
Engelsk titel

Statistics 2 (Stat2)

Uddannelse
Bacheloruddannelsen i matematik
Bacheloruddannelsen i forsikringsmatematik
Bacheloruddannelsen matematik-økonomi
Bacheloruddannelsen i naturvidenskab og it
Kursusindhold

Normalfordelingsmodeller Udgangspunktet  er den behandling den lineære normale model har fået på kurset Stat1. Vi vil forudsætte et solidt greb om den geometriske synsvinkel på den lineære model, og fortrolighed med modellens simpleste manifestationer: lineær regression og et- og tosidet variansanalyse. Vi vil udvide dette kendskab i forskellige retninger. Den ene udvidelse er i form af de såkaldte flerfaktormodeller, der nemmest beskrives som k-sidede variansanalyser, hvor k er 3, 4,  5,... Der er tekniske vanskeligheder forbundet med denne udvidelse af den tosidede variansanalyse, og dem skal vi naturligvis lære at håndtere. Men først og fremmest vil vi beskæftige os med de konceptuelle vanskeligheder, der opstår, når modellerne bliver store. Der er tale om vanskeligheder med at fortolke modellerne, med at validere dem og måske især med at få valgt den rette model til de konkrete data. Disse vanskeligheder er ikke specifikke for flerfaktormodellerne - tværtimod optræder de overalt i statistikken. Men flerfaktormodellerne giver en god ramme at studere problemerne i, fordi man her, i højere grad end i så mange andre modelklasser, kan regne ting igennem og få eksplicitte svar. Den anden udvidelse er i form af de såkaldte random effects modeller (eller mixed models eller varianskomponentmodeller eller...) der udvider den lineære normale model ved at inddrage stokasticitet på flere niveauer. Man forsøger at håndtere problemer som dem man kan finde når man undersøger skolebørns prøveresultater: Det enkelte barn er den primære 'støjkilde', men børn i samme klasse vil typisk præstere resultater, der er tæt beslægtet med hinanden - der findes gode og dårlige klasser. Der findes sikkert også gode og dårlige lærere, men hvordan kan man separere en lærereffekt fra en klasseeffekt, når alle eleverne i en klasse har haft den samme lærer? Hvordan skal man nogensinde kunne undersøge effekten af en metode til f.eks. læseindlæring, når den bliver mudret op af eleveffekter, klasseeffekter og lærereffekter?

Asymptotisk teori De lineære normale modeller er specielle derved at man kan regne alt  (eller næsten alt) igennem eksplicit. Den mulighed har man ikke i andre modelklasser. Når man ikke har eksplicitte formler for estimatorerne, så har man heller ikke eksakte fordelingsresultater. Man skulle tro at det umuliggjorde egentlig inferens. Men det viser sig at man i en forbløffende bred vifte af modeller kan opnå gode approksimative fordelingsresultater, og dermed alligevel gennemføre en analyse. Disse approksimative fordelingsresultater kommer fra store tals lov og - især  - den centrale grænseværdisætning. De er dermed asymptotiske i deres natur, hvilket vil sige at man kun kan fæste lid til dem hvis man i en eller anden forstand har mange enkeltmålinger. Vi skal se hvordan disse asymptotiske resultater dukker op, og vi skal oparbejde en vis erfaring for hvornår man kan bruge dem.

Regression I  beskrivelsen af flerfaktormodeller og til en vis grad også random  effects modeller ligger der en bestemt tankefigur om hvad et eksperiment  er. I den verden kan deleksperimenter gentages med stor præcision. Man får ikke nødvendigvis samme måleresultat frem i sådan en gentagelse, men alle andre forhold ved deleksperimentet kan reproduceres. Specielt er kovariater under eksperimentatorens kontrol. Denne tankefigur svarer ret dårligt til hvad der sker i observationelle videnskaber som f.eks. økonomi. Her må man som regel betragte 'kovariater' som lige så stokastiske som 'måleresultater' - det er simpelthen kunstigt at opretholde en distinktion mellem dem. Det fører dels til tekniske vanskeligheder med at regne i modellerne, og dels til konceptuelle vanskeligheder med at forstå hvad modellerne egentligt siger. At diskutere sammenhænge mellem stokastiske variable kaldes som regel regression.

Målbeskrivelser
Viden:
Den studerende skal kende til normalfordelingsmodeller, specifikt flerfaktormodeller og hierarkiske modeller. Derudover skal den studerende kende til asymptotisk teori.

Færdigheder:

Ved kursets afslutning forventes den studerende at kunne:
  • fortolke statistiske modeller med multifaktorielle middelværdibeskrivelser og at kunne udregne estimatorer, teststørreler mv. i normalfordelingsmodeller med partielt balancerede design ved hjælp af ortogonal dekomposition.
  • forstå forskellen mellem modeller med uafhængige variable og modeller med en hierarkisk korrelationsstruktur, og at kunne udregne estimatorer, teststørrelser mv. i faktorforsøgsmodeller med tilfældige effekter.
  • håndtere asymptotiske argumenter, herunder finde asymptotiske fordelinger
    • for størrelser givet ved eksplicitte formler
    • for implicit givne størrelser i simple modeller

Kompetencer:

Den studerende skal kunne diskutere statistiske udsagn.

Stat1 eller tilsvarende.
2 + 2 timers forelæsninger, 2 + 2 timers øvelser, 2 regn-selv timer per uge i 7 uger.
Point
7,5 ECTS
Prøveform
Mundtlig prøve, 20 min incl votering
20 minutters forberedelsestid
Krav til indstilling til eksamen
Godkendelse af en øvelsesrapport
Hjælpemidler
Alle hjælpemidler tilladt
Bedømmelsesform
7-trins skala
Censurform
Ekstern censur
Kriterier for bedømmelse

Den studerende skal på tilfredsstillende måde godtgøre at han/hun lever op til fagets målbeskrivelse.

  • Kategori
  • Timer
  • Forelæsninger
  • 28
  • Projektarbejde
  • 35
  • Praktiske øvelser
  • 21
  • Forberedelse
  • 100
  • Eksamen
  • 1
  • Teoretiske øvelser
  • 21
  • I alt
  • 206