SPMM21009U Data science

Årgang 2021/2022
Engelsk titel

Data Science

Uddannelse

Dette kursus udbydes på Master i Personlig Medicin.

Masteruddannelsen er efteruddannelse for sundhedsprofessionelle.

Master i personlig medicin er udviklet i tæt samarbejde mellem de fire sundhedsvidenskabelige fakulteter på hhv. Københavns Universitet, Aarhus Universitet, Aalborg Universitet og Syddansk Universitet samt Danmarks Tekniske Universitet. På den måde sikrer vi, at du bliver undervist af nationale eksperter fra internationalt anerkendte forskningsmiljøer i Danmark.

Læs mere om uddannelsen på hjemmesiden: www.personligmedicin.ku.dk 

 

Kursusindhold

Du vil lære “best practices” inden for dataanalyse fra basal datahåndtering til visualisering og avanceret modellering.

Stadig større mængder af data bliver indsamlet i sundhedsvæsnet fra genomiske analyser, wearable devices samt elektroniske patientjournaler. Dette kursus vil give dig de nødvendige data science færdigheder det kræver at analysere sådanne store datasæt.

Vi vil gennemgå de forskellige skridt i en analyse fra indlæsning og transformering af data til visualisering, statistisk analyse og machine learning (både supervised og unsupervised learning).

Du vil lære om værktøjer der kan hjælpe med at lave overskuelige og reproducerbare analyser såsom software til versionskontrol og workflow-håndtering og blive introduceret til brug af High Perfomance Computing (HPC) og parallelisering.

Undervisningen vil være hands-on hvor du skal analysere relevante datasæt kombineret med systematisk gennemgang af de forskellige metoder og værktøjer, herunder kilder til fejl, variation og usikkerhed.

Dataanalysen vil foregå vha. R (tidyverse) og erfaring med brug af R er en fordel. Erfaring kan med R kan eventuelt opnås ved selvstudium i forbindelse med kurset.

Målbeskrivelser

Efter endt kursus forventes den studerende at:

Viden:

  • have tilegnet sig viden om principperne bag tidyverse’s data håndtering, visualisering, modelering, og analyse.
  • have viden om forskellige machine learning metoder (både supervised og unsupervised learning) og hvornår de kan anvendes.
  • have viden om brug af high performance computing (HPC) til analyse af store datasæt.
  • have viden om machine learning metoders muligheder og begrænsninger i forhold til forskellige problemstillinger og mængden af tilgængeligt data.

 

Færdigheder:

  • være i stand til at følge og forholde sig kritisk til videnskabelige analyser af store datasæt [eksisterende].

  • være i stand til at anvende individuelle funktioner i tidyverse, herunder kunne formatere, visualisere, modellere, og udføre inferens på data.   

 

Kompetencer:

  • kunne bruge tidyverse til at udføre en komplette dataanalyser, startende fra indhentning og formatering af rå data, over visualisering, til modellering og inferens.

  • kunne vurdere muligheder og begrænsninger for dataanalyser i sundhedsfaglige sammenhænge.

     

Artikler og udvalgte bogkapitler

Litteraturlisten findes på e-læringsportalen Absalon

 

Læs mere om ansøgningskrav på uddannelsens hjemmeside: www.personligmedicin.ku.dk/​adgangskrav/​
2 x 2 dages fysisk fremmøde
5 online sessioner
Projektarbejde samt rapportskrivning.

Kurset afsluttes med et tværfagligt gruppearbejde der tager udgangspunkt i en case.
  • Kategori
  • Timer
  • Forelæsninger
  • 6
  • Holdundervisning
  • 10
  • Forberedelse (anslået)
  • 80
  • E-læring
  • 10
  • Projektarbejde
  • 22
  • Eksamen
  • 10
  • I alt
  • 138
Løbende feedback i undervisningsforløbet
Point
5 ECTS
Prøveform
Portfolio
Kurset benytter portfolio-eksamen uden censur og bedømmes som bestået / ikke bestået i forhold til de opstillede læringsmål. De studerende evalueres løbende ud fra mindre tests og opgaver igennem kurset samt bidrag til det afsluttende gruppearbejde.
Hjælpemidler
Alle hjælpemidler tilladt
Bedømmelsesform
bestået/ikke bestået
Censurform
Ingen ekstern censur
Eksamensperiode

Se information om eksamenstidspunkt i uddannelsens eksamensplanen. Eksamensplanen offentliggøres på denne hjemmeside:  https://sund.ku.dk/uddannelse/studieinformation/eksamensplaner/

Reeksamen

Se information om tidspunkt for reeeksamen i uddannelsens eksamensplanen. Eksamensplanen offentliggøres på denne hjemmeside:  https://sund.ku.dk/uddannelse/studieinformation/eksamensplaner/

Kriterier for bedømmelse

For at opnå bedømmelsen Bestået skal den studerende:

Viden:

  • have tilegnet sig viden om principperne bag tidyverse’s data håndtering, visualisering, modelering, og analyse.
  • have viden om forskellige machine learning metoder (både supervised og unsupervised learning) og hvornår de kan anvendes.
  • have viden om brug af high performance computing (HPC) til analyse af store datasæt.
  • have viden om machine learning metoders muligheder og begrænsninger i forhold til forskellige problemstillinger og mængden af tilgængeligt data.

 

Færdigheder:

  • være i stand til at følge og forholde sig kritisk til videnskabelige analyser af store datasæt [eksisterende].

  • være i stand til at anvende individuelle funktioner i tidyverse, herunder kunne formatere, visualisere, modellere, og udføre inferens på data.   

 

Kompetencer:

  • kunne bruge tidyverse til at udføre en komplette dataanalyser, startende fra indhentning og formatering af rå data, over visualisering, til modellering og inferens.

  • kunne vurdere muligheder og begrænsninger for dataanalyser i sundhedsfaglige sammenhænge.