NBIB21000U Analyse og visualisering af biologiske datasæt

Årgang 2021/2022
Engelsk titel

Data Analysis and Visualization for Biological Datasets

Uddannelse

Bacheloruddannelsen i biokemi
Bacheloruddannelsen i biologi

Kursusindhold

Dette kursus bygger på de grundlæggende principper fra statistik, og fokuserer hovedsageligt på praktiske og effektive anvendelser af R til at løse virkelige problemstillinger inden for det biologiske område. Kurset beskæftiger sig blandt andet med håndteringen af den stigende mængde af molekylære data, som bliver offentligt tilgængelige, og kan fungere som udgangspunkt til eventuelle senere projekter indenfor bioinformatik og molekylær biologi.

De studerende vil lære nye metoder til at analysere store datasæt og blive trænet i at lave hensigtsmæssige grafer og visualiseringer af deres data, som kan støtte dataanalysen og bidrage til effektiv formidling af biologiske resultater. Hovedfokus vil være på datasæt fra studier omhandlende gen-ekspression, genomisk data og fra forskellige ”high through-put” metoder. For studerende med interesse for økologiske datasæt anbefales kurset ”Økologisk dataanalyse med R”.

De studerende kommer til at udvide deres kendskab til R ved at lære en række nye værktøjer, som især er velegnet til både at håndtere data og omsætte den til figurer med henblik på publicering og/eller præsentation.


Dette kursus indeholder bl.a.:

  • Import og organisering af store biologiske datasæt via R-pakken tidyverse
  • Benyttelse af funktioner, loops og matricer i R
  • R-pakken ggplot2, som gør det nemmere at lave figurer af høj kvalitet
  • Clustering metoder og algorithmer samt principal component analyse (PCA) for at lave effektiv visualisering af genomisk data af høj dimension
  • Godt eksperimental design og brugen af plots som tilgang til at vurdere mulige artefakter
  • Anvendelse af statistiske tests til at teste hypoteser omkring datasæt
  • Rapportering af analyser ved brug af R markdown
     
Målbeskrivelser

Kursets læringsmål er at give de studerende viden og færdigheder til at analysere biologiske datasæt og visualisere resultaterne af analyserne samt at kunne dokumentere analysen og gøre den producerbar.
 

Viden:

Ved afslutningen af kurset, er de studerende i stand til at:

  • Kende og benytte relevante statistiske analysemetoder for store datasæt.
  • Kende og benytte god praksis for reproducerbar dataanalyse.
  • Kende og benytte basale regler til effektiv data visualisering.

 

rdigheder:

Ved afslutningen af kurset, er de studerende i stand til at:

  • Anvende R og R pakker til dataanalyser.
  • Kode enkle R funktioner og anvende loops til at gøre dataanalyse reproducerbar.
  • Benytte R markdown til at dokumentere deres dataanalyser.
  • Benytte R til at plotte og visualisere data.

 

Kompetencer:

Ved afslutningen af kurset, er de studerende i stand til at:

  • Udføre en statistisk korrekt, reproducerbar og veldokumenteret analyse af et biologisk datasæt.
  • Visualisere resultater af dataanalyse så disse effektivt gengiver de vigtigste resultater.
Det forventes at de studerende har bestået et kursus i statistik og har basalt kendskab til R, svarende til enten Matematik/Statistik for biologer, Statistik for biokemikere (StatBK) eller lignende. Indholdet af dette kursus overlapper til dels med pensum i kurset ”Økologisk dataanalyse med R” og det anbefales ikke for studerende at tage begge kurser.
Hybrid mellem forelæsninger og computer øvelser. Udvalgte online video tutorials vil være til rådighed. I løbet af kurset vil der være én eller flere pre-tests.
Kurset er identisk med det nedlagte kursus NBIB20001U Visualisering af biologiske datasæt. Du kan altså ikke kan tage NBIB21000U - Analyse og visualisering af biologiske datasæt, hvis du allerede har bestået NBIB20001U Visualisering af biologiske datasæt.
Hvis du er registreret med eksamensforsøg i NBIB20001U Visualisering af biologiske datasætuden at bestå, skal du bruge dine sidste eksamensforsøg på at bestå eksamen i NBIB21000U - Analyse og visualisering af biologiske datasæt. Du har i alt tre eksamensforsøg.
  • Kategori
  • Timer
  • Forelæsninger
  • 32
  • Forberedelse (anslået)
  • 129
  • Praktiske øvelser
  • 32
  • Eksamensforberedelse
  • 9
  • Eksamen
  • 4
  • I alt
  • 206
Skriftlig
Individuel

Individuel feedback på pre-tests.

Point
7,5 ECTS
Prøveform
Skriftlig prøve, 4 timer
Eksamen består af en praktisk analyse af et datasæt. Karaktergivning er baseret på analysens reproducerbarhed, relevans og kvaliteten af præsentationen af analysen. De studerende vil få forskellige delmængder af et større datasæt at analysere.

Instituttet afholder selv denne eksamen.
Hjælpemidler
Alle hjælpemidler tilladt
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Flere interne bedømmere.
Reeksamen

Samme som ordinær eksamen.

Kriterier for bedømmelse

For at opnå karakteren 12, skal den studerende overbevisende og præcist kunne demonstrere viden, færdigheder og kompetencer som beskrevet under målbeskrivelsen.