SPMM21009U Data science
Data Science
Dette kursus udbydes på Master i Personlig Medicin.
Masteruddannelsen er efteruddannelse for sundhedsprofessionelle.
Master i personlig medicin er udviklet i tæt samarbejde mellem de fire sundhedsvidenskabelige fakulteter på hhv. Københavns Universitet, Aarhus Universitet, Aalborg Universitet og Syddansk Universitet samt Danmarks Tekniske Universitet. På den måde sikrer vi, at du bliver undervist af nationale eksperter fra internationalt anerkendte forskningsmiljøer i Danmark.
Læs mere om uddannelsen på hjemmesiden: www.personligmedicin.ku.dk
Du vil lære “best practices” inden for dataanalyse fra basal datahåndtering til visualisering og avanceret modellering.
Stadig større mængder af data bliver indsamlet i sundhedsvæsnet fra genomiske analyser, wearable devices samt elektroniske patientjournaler. Dette kursus vil give dig de nødvendige data science færdigheder det kræver at analysere sådanne store datasæt.
Vi vil gennemgå de forskellige skridt i en analyse fra indlæsning og transformering af data til visualisering, statistisk analyse og machine learning (både supervised og unsupervised learning).
Du vil lære om værktøjer der kan hjælpe med at lave overskuelige og reproducerbare analyser såsom software til versionskontrol og workflow-håndtering og blive introduceret til brug af High Perfomance Computing (HPC) og parallelisering.
Undervisningen vil være hands-on hvor du skal analysere relevante datasæt kombineret med systematisk gennemgang af de forskellige metoder og værktøjer, herunder kilder til fejl, variation og usikkerhed.
Dataanalysen vil foregå vha. R (tidyverse) og erfaring med brug af R er en fordel. Erfaring kan med R kan eventuelt opnås ved selvstudium i forbindelse med kurset.
Efter endt kursus forventes den studerende at:
Viden:
- have tilegnet sig viden om principperne bag tidyverse’s data håndtering, visualisering, modelering, og analyse.
- have viden om forskellige machine learning metoder (både supervised og unsupervised learning) og hvornår de kan anvendes.
- have viden om brug af high performance computing (HPC) til analyse af store datasæt.
- have viden om machine learning metoders muligheder og begrænsninger i forhold til forskellige problemstillinger og mængden af tilgængeligt data.
Færdigheder:
være i stand til at følge og forholde sig kritisk til videnskabelige analyser af store datasæt [eksisterende].
være i stand til at anvende individuelle funktioner i tidyverse, herunder kunne formatere, visualisere, modellere, og udføre inferens på data.
Kompetencer:
kunne bruge tidyverse til at udføre en komplette dataanalyser, startende fra indhentning og formatering af rå data, over visualisering, til modellering og inferens.
kunne vurdere muligheder og begrænsninger for dataanalyser i sundhedsfaglige sammenhænge.
Artikler og udvalgte bogkapitler
Litteraturlisten findes på e-læringsportalen Absalon
5 online sessioner
Projektarbejde samt rapportskrivning.
Kurset afsluttes med et tværfagligt gruppearbejde der tager udgangspunkt i en case.
- Kategori
- Timer
- Forelæsninger
- 6
- Holdundervisning
- 10
- Forberedelse (anslået)
- 80
- E-læring
- 10
- Projektarbejde
- 22
- Eksamen
- 10
- I alt
- 138
Du kan ansøge om deltagelse på kurset som enkeltfagsstuderende. Læs mere og ansøg på uddannelsens hjemmeside: www.personligmedicin.ku.dk/adgangskrav/
- Point
- 5 ECTS
- Prøveform
- PortfolioKurset benytter portfolio-eksamen uden censur og bedømmes som bestået / ikke bestået i forhold til de opstillede læringsmål. De studerende evalueres løbende ud fra mindre tests og opgaver igennem kurset samt bidrag til det afsluttende gruppearbejde.
- Hjælpemidler
- Alle hjælpemidler tilladt
- Bedømmelsesform
- bestået/ikke bestået
- Censurform
- Ingen ekstern censur
- Eksamensperiode
Se information om eksamenstidspunkt i uddannelsens eksamensplanen. Eksamensplanen offentliggøres på denne hjemmeside: https://sund.ku.dk/uddannelse/studieinformation/eksamensplaner/
- Reeksamen
Se information om tidspunkt for reeeksamen i uddannelsens eksamensplanen. Eksamensplanen offentliggøres på denne hjemmeside: https://sund.ku.dk/uddannelse/studieinformation/eksamensplaner/
Kriterier for bedømmelse
For at opnå bedømmelsen Bestået skal den studerende:
Viden:
- have tilegnet sig viden om principperne bag tidyverse’s data håndtering, visualisering, modelering, og analyse.
- have viden om forskellige machine learning metoder (både supervised og unsupervised learning) og hvornår de kan anvendes.
- have viden om brug af high performance computing (HPC) til analyse af store datasæt.
- have viden om machine learning metoders muligheder og begrænsninger i forhold til forskellige problemstillinger og mængden af tilgængeligt data.
Færdigheder:
være i stand til at følge og forholde sig kritisk til videnskabelige analyser af store datasæt [eksisterende].
være i stand til at anvende individuelle funktioner i tidyverse, herunder kunne formatere, visualisere, modellere, og udføre inferens på data.
Kompetencer:
kunne bruge tidyverse til at udføre en komplette dataanalyser, startende fra indhentning og formatering af rå data, over visualisering, til modellering og inferens.
kunne vurdere muligheder og begrænsninger for dataanalyser i sundhedsfaglige sammenhænge.
Kursusinformation
- Sprog
- Dansk
- Kursuskode
- SPMM21009U
- Point
- 5 ECTS
- Niveau
- Master
- Varighed
- 1 semester
- Placering
- Efterår
- Skemagruppe
- - 2 x 2 dages fysisk fremmøde
- 5 online sessioner
- Projektarbejde samt rapportskrivning. - Kursuskapacitet
- 30
- Kurset udbydes også til efter- og videreuddannelse
- Studienævn
- Studienævnet for Masteruddannelserne ved Det Sundhedsvidenskabelige Fakultet
Udbydende institut
- Institut for Klinisk Medicin
Udbydende fakultet
- Det Sundhedsvidenskabelige Fakultet
Kursusansvarlige
- Sisse Rye Ostrowski (sisse.rye.ostrowski@regionh.dk)
Undervisere
Kursusansvarlige:
Jakob Skou Pedersen, Professor, Aarhus Universitet.
Søren Besenbacher, Lektor, Aarhus Universitet.