Engelsk   Dansk
Velkommen til Københavns Universitets kursuskatalog

NMAA05085U  Statistik 2 (Stat2) Årgang 2013/2014

Engelsk titel
Statistics 2 (Stat2)

Kursusinformation

SprogDansk
Point7,5 ECTS
NiveauBachelor
Varighed1 blok
Placering
Blok 4
Skemagruppe
A
KursuskapacitetIngen begrænsninger
Efter- og videreuddannelse
StudienævnStudienævn for Matematik og Datalogi
Udbydende institut
  • Institut for Matematiske Fag
Kursusansvarlig
  • Susanne Ditlevsen (7-75777563707067426f63766a306d7730666d)
Telefon +45 35 32 07 85, kontor 04.4.13,
Undervisere
Susanne Ditlevsen
Gemt den 31-10-2013
Uddannelse
Bacheloruddannelsen i matematik
Bacheloruddannelsen i forsikringsmatematik
Bacheloruddannelsen matematik-økonomi
Bacheloruddannelsen i naturvidenskab og it
Kursusindhold

Normalfordelingsmodeller Udgangspunktet  er den behandling den lineære normale model har fået på kurset Stat1. Vi vil forudsætte et solidt greb om den geometriske synsvinkel på den lineære model, og fortrolighed med modellens simpleste manifestationer: lineær regression og et- og tosidet variansanalyse. Vi vil udvide dette kendskab i forskellige retninger. Den ene udvidelse er i form af de såkaldte flerfaktormodeller, der nemmest beskrives som k-sidede variansanalyser, hvor k er 3, 4,  5,... Der er tekniske vanskeligheder forbundet med denne udvidelse af den tosidede variansanalyse, og dem skal vi naturligvis lære at håndtere. Men først og fremmest vil vi beskæftige os med de konceptuelle vanskeligheder, der opstår, når modellerne bliver store. Der er tale om vanskeligheder med at fortolke modellerne, med at validere dem og måske især med at få valgt den rette model til de konkrete data. Disse vanskeligheder er ikke specifikke for flerfaktormodellerne - tværtimod optræder de overalt i statistikken. Men flerfaktormodellerne giver en god ramme at studere problemerne i, fordi man her, i højere grad end i så mange andre modelklasser, kan regne ting igennem og få eksplicitte svar. Den anden udvidelse er i form af de såkaldte random effects modeller (eller mixed models eller varianskomponentmodeller eller...) der udvider den lineære normale model ved at inddrage stokasticitet på flere niveauer. Man forsøger at håndtere problemer som dem man kan finde når man undersøger skolebørns prøveresultater: Det enkelte barn er den primære 'støjkilde', men børn i samme klasse vil typisk præstere resultater, der er tæt beslægtet med hinanden - der findes gode og dårlige klasser. Der findes sikkert også gode og dårlige lærere, men hvordan kan man separere en lærereffekt fra en klasseeffekt, når alle eleverne i en klasse har haft den samme lærer? Hvordan skal man nogensinde kunne undersøge effekten af en metode til f.eks. læseindlæring, når den bliver mudret op af eleveffekter, klasseeffekter og lærereffekter?

Asymptotisk teori De lineære normale modeller er specielle derved at man kan regne alt  (eller næsten alt) igennem eksplicit. Den mulighed har man ikke i andre modelklasser. Når man ikke har eksplicitte formler for estimatorerne, så har man heller ikke eksakte fordelingsresultater. Man skulle tro at det umuliggjorde egentlig inferens. Men det viser sig at man i en forbløffende bred vifte af modeller kan opnå gode approksimative fordelingsresultater, og dermed alligevel gennemføre en analyse. Disse approksimative fordelingsresultater kommer fra store tals lov og - især  - den centrale grænseværdisætning. De er dermed asymptotiske i deres natur, hvilket vil sige at man kun kan fæste lid til dem hvis man i en eller anden forstand har mange enkeltmålinger. Vi skal se hvordan disse asymptotiske resultater dukker op, og vi skal oparbejde en vis erfaring for hvornår man kan bruge dem.

Regression I  beskrivelsen af flerfaktormodeller og til en vis grad også random  effects modeller ligger der en bestemt tankefigur om hvad et eksperiment  er. I den verden kan deleksperimenter gentages med stor præcision. Man får ikke nødvendigvis samme måleresultat frem i sådan en gentagelse, men alle andre forhold ved deleksperimentet kan reproduceres. Specielt er kovariater under eksperimentatorens kontrol. Denne tankefigur svarer ret dårligt til hvad der sker i observationelle videnskaber som f.eks. økonomi. Her må man som regel betragte 'kovariater' som lige så stokastiske som 'måleresultater' - det er simpelthen kunstigt at opretholde en distinktion mellem dem. Det fører dels til tekniske vanskeligheder med at regne i modellerne, og dels til konceptuelle vanskeligheder med at forstå hvad modellerne egentligt siger. At diskutere sammenhænge mellem stokastiske variable kaldes som regel regression.

Målbeskrivelser
Viden:
Den studerende skal kende til normalfordelingsmodeller, specifikt flerfaktormodeller og hierarkiske modeller. Derudover skal den studerende kende til asymptotisk teori.

Færdigheder:

Ved kursets afslutning forventes den studerende at kunne:
  • fortolke statistiske modeller med multifaktorielle middelværdibeskrivelser og at kunne udregne estimatorer, teststørreler mv. i normalfordelingsmodeller med partielt balancerede design ved hjælp af ortogonal dekomposition.
  • forstå forskellen mellem modeller med uafhængige variable og modeller med en hierarkisk korrelationsstruktur, og at kunne udregne estimatorer, teststørrelser mv. i faktorforsøgsmodeller med tilfældige effekter.
  • håndtere asymptotiske argumenter, herunder finde asymptotiske fordelinger
    • for størrelser givet ved eksplicitte formler
    • for implicit givne størrelser i simple modeller

Kompetencer:

Den studerende skal kunne diskutere statistiske udsagn.

Undervisningsform
2 + 2 timers forelæsninger, 2 + 2 timers øvelser, 2 regn-selv timer per uge i 7 uger.
Faglige forudsætninger
Stat1 eller tilsvarende.
Tilmelding
Selvbetjeningen på KUnet
Eksamen
Point7,5 ECTS
Prøveform
Mundtlig prøve, 20 min incl votering
20 minutters forberedelsestid
Krav til indstilling til eksamenGodkendelse af en øvelsesrapport
HjælpemidlerAlle hjælpemidler tilladt
Bedømmelsesform7-trins skala
CensurformEkstern censur
Kriterier for bedømmelse

Den studerende skal på tilfredsstillende måde godtgøre at han/hun lever op til fagets målbeskrivelse.

Arbejdsbelastning
KategoriTimer
Forelæsninger28
Projektarbejde35
Praktiske øvelser21
Forberedelse100
Eksamen1
Teoretiske øvelser21
I alt206
Gemt den 31-10-2013