NIGB21023U Data-analyse og præsentation med Python

Årgang 2026/2027
Engelsk titel

Data Analysis and Presentation Using Python

Uddannelse

Bacheloruddannelsen i geologi-geoscience

Kursusindhold

I kurset undervises deltagerne i at organisere geovidenskabelige data på måder, der fremmer effektiv deling af data, og som muliggør en effektiv viderebearbejdelse, analyse og præsentation af data i figurer/illustrationer ved brug af Excel og Python og i relation til hypotesetestning og videnskabelig teori. Målet med kurset er, at deltagerne:

  • får praktisk erfaring med organisering af eksisterende og nye data i strukturerede dataformater, på et teoretisk grundlag, hovedsageligt i Excel.
  • lærer at bearbejde data så dette (i) klargøres til en effektiv og hurtig dataanalyse og (ii) præsenteres i figurer af høj kvalitet dannet i Python.
  • lærer at skabe fokuserede figurer/illustrationer som kommunikerer hovedbudskabet klart og effektivt.
  • lærer en række metoder som typisk anvendes ved databehandling i Python, så som indlæsning/udlæsning af filer, downsampling/upsampling af tidsserier, merge, loops, pandasql, m.fl.
     

Deltagerene vil lære at kombinere brugen af Excel med open source programmet Python (med Spyder som IDE) som redskaber til etablering relationelle og flat-form databaser, databearbejdning, analyse og præsentation i figurer. Deltagerne vil stifte bekendtskab med brugen af AI (kunstig intelligens) i form af ChatGPT som sparringspartner til programmering i Python.

Deltagerene vil blive præsenteret for geovidenskabelige eksempler fra disciplinerne hydrogeologi og hydrogeokemi, som er underviserens forskningsfelter. Deltagere fra et bredt felt af discipliner er dog velkomne. Alle deltagere har mulighed for at medbringe data (feltnoter, værdier, tabeller, regneark, billeder, m.v.) fra egne felt- eller laboratoriearbejder (hvis muligt) og at arbejde med disse data i dele af kurset. Alternativt kan arbejdes med udleverede data.

Målbeskrivelser

Viden:

  • En teoretisk basis for strukturering af data i tabeller (Excel).
  • Evaluering af data-/tekstfils-formater (f.eks. CSV).
  • Numeriske vs. kategoriske variable, og andre datatyper, inkl. datetime.
  • Python og Spyder.
  • Teknikker til at udfærdige fokuserede illustrationer.
  • Python-pakker, særligt pandas, seaborn og matplotlib.
  • Down- og up-sampling af tidsserier.
  • Indlæsning af data fra flere filer til ét datasæt (glob).
  • Indlæsning af data fra DMIs MetObs API.


Færdigheder:

  • At håndtere data ikke-destruktivt.
  • At organisere data på måder, der muliggør opbevaring og/eller deling af data.
  • At evaluere hvilke datatyper en database har behov for at kunne rumme.
  • At skabe fokuserede tabeller, grafer, og illustrationer som behandler specifikke sammenhænge i data, ud fra hvilke der kan drages konklusioner.
  • Grundlæggende færdigheder til databehandling i Python og Excel. 
  • At anvende AI som sparringspartner i forbindelse med python-programmering.


Kompetencer:

  • At udvikle strukturerede databaser som muliggør effektiv, hurtig, og avanceret databearbejdning og som understøtter deling af data.
  • At anvende andres data og databaser effektivt og ikke-destruktivt.
  • At evaluere passende måder at præsentere data/​​resultater.
  • At skabe informative illustrationer af data som muliggør at der drages konklusioner.
  • At håndtere data på baggrund af teoretisk forståelse af datastruktur.
  • At udvikle Python-kode selvstændigt. 

Se kursushjemmesiden på Absalon.

For at følge undervisningen anbefales et fagligt niveau svarende til de obligatoriske kurser på 1. og 2. år af en geovidenskabelig BSc-uddannelse på SCIENCE. Kurset er et begynderkursus i Python, og egner sig ikke til studerende med forudgående indgående kendskab til Python.
Undervisningen foregår ved forberedelse, forelæsninger i mindre omfang, fælles diskussioner, og i særlig grad via øvelser og arbejde med data. I øvelserne og i arbejdet med data vejledes de studerende i selvstændig brug/søgning i online kilder, så som fra google, stackoverflow, w3schools, geksforgeeks, og i brug af AI (f.eks. ChatGPT), samt i dokumentationen til anvendte Python-pakker (lær-at-lære). Hver enkelt deltager skriver gradvist i løbet af kurset sit eget kompendium til faget, som ved afslutningen af kurset vil udgøre den enkelte studerendes egen "Guide til datahåndtering ved brug af Python".
  • Kategori
  • Timer
  • Forelæsninger
  • 28
  • Forberedelse (anslået)
  • 150
  • Øvelser
  • 28
  • I alt
  • 206
Mundtlig
Løbende feedback i undervisningsforløbet
Feedback ved afsluttende eksamen (ud over karakteren)
Peerfeedback (studerende giver hinanden feedback)

Til den løbende udfærdigede version af hver studerendes kompendium vil kursusdeltagerne løbende modtage mundtlig feedback fra underviseren og skriftlig feedback fra medstuderende via Absalon/FeedbackFruits. Deltagerne vil modtage skriftlig feedback og karaktér for den endelige version af deres egen afleverede kompendium.

Point
7,5 ECTS
Prøveform
Skriftlig aflevering, Løbende
Prøveformsdetaljer
Hver enkelt deltager skriver i løbet af kurset sit eget kompendium til faget, som ved afslutningen af kurset vil udgøre hver enkelts "Guide til datahåndtering ved brug af Python". Kompendiet afleveres ved afslutningen af kurset.
Hjælpemidler
Alle hjælpemidler tilladt
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Flere interne bedømmere.
Reeksamen

(Gen)aflevering af (eventuelt revideret) kompendium i form af deltagerens egen 'Guide til datahåndtering ved brug af Python', som skal afleveres inden reeksamensugen.

Kriterier for bedømmelse

Der henvises til målbeskrivelsen.