NIGB21023U Data-analyse og præsentation med Python

Årgang 2024/2025
Engelsk titel

Data Analysis and Presentation Using Python

Uddannelse

Bacheloruddannelsen i geologi-geoscience

Kursusindhold

I kurset undervises deltagerne i at organisere geovidenskabelige data på måder, der fremmer effektiv deling af data, og som muliggør en effektiv viderebearbejdelse, analyse og præsentation af data i figurer/illustrationer ved brug af Excel og Python og i relation til hypotesetestning og videnskabelig teori. En vigtig komponent i kurset er desuden effektiv skriftlig videnskabelig kommunikation, f.eks. i forbindelse med rapportskrivning. Målet med kurset er, at deltagerne:

  • får praktisk erfaring med organisering af eksisterende og nye data i strukturerede dataformater, på et teoretisk grundlag, hovedsageligt i Excel.
  • lærer at bearbejde data så dette (i) klargøres til en effektiv og hurtig dataanalyse og (ii) præsenteres i figurer af høj kvalitet dannet i Python.
  • lærer at skrive klart, præcist, og kondenseret med korrekt brug af referencer (forfatter(e), årstal), korrekt syntaks og uden skrifttekniske fejl.
  • lærer at skabe fokuserede figurer/illustrationer som kommunikerer hovedbudskabet klart og effektivt.

 

Deltagerene vil lære at kombinere brugen af Excel med open source programmet Python (med Spyder som IDE) som redskaber til etablering relationelle og flat-form databaser, databearbejdning, analyse og præsentation i figerer. Deltagerne vil stifte bekendtskab med brugen af AI (kunstig intelligens) i form af ChatGPT som sparringspartner til programmering i Python.

 

Deltagerene vil blive præsenteret for geovidenskabelige eksempler fra disciplinerne hydrogeologi og hydrogeokemi, som er underviserens forskningsfelter. Deltagere fra et bredt felt af discipliner er dog velkomne. Alle deltagere har mulighed for at medbringe data (feltnoter, værdier, tabeller, regneark, billeder, m.v.) fra egne felt- eller laboratoriearbejder (hvis muligt) og at arbejde med disse data i dele af kurset. Alternativt kan arbejdes med udleverede data.

Målbeskrivelser

Viden:

  • En teoretisk basis for strukturering af data i tabeller (Excel).
  • Evaluering af data-/tekstfils-formater (f.eks. CSV).
  • Numeriske vs. kategoriske variable, og andre datatyper, inkl. datetime.
  • Python og Spyder.
  • Teknikker til at udfærdige fokuserede illustrationer.
  • Skriftteknik: brug af krydsreferencer, litteraturhenvisninger, fodnoter, tegnsætning, tabel- og figur-beskrivelser, og krav til sætningsopbygning/​syntax.
  • Strukturering og kondensering af tekster.
  • Opbygning af rapporter (IMRaD).
  • Python-pakker, særligt pandas, seaborn og matplotlib.
  • Down- og up-sampling af tidsserier.
  • Indlæsning af data fra flere filer til ét datasæt (glob).
  • Indlæsning af data fra DMIs MetObs API.


Færdigheder:

  • At håndtere data ikke-destruktivt.
  • At organisere data på måder, der muliggør opbevaring og/eller deling af data.
  • At evaluere hvilke datatyper en database har behov for at kunne rumme.
  • At skabe fokuserede tabeller, grafer, og illustrationer som behandler specifikke sammenhænge i data, ud fra hvilke der kan drages konklusioner.
  • At evaluere, give og modtage kritik af skriftlige arbejder.
  • At forbedre sin skrivning via bevidsthed om syntaks, skriftteknik, og muligheder for kondensering.
  • At anvende AI som sparringspartner i forbindelse med python-programmering.


Kompetencer:

  • At udvikle strukturerede databaser som muliggør effektiv, hurtig, og avanceret databearbejdning og som understøtter deling af data.
  • At anvende andres data og databaser effektivt og ikke-destruktivt.
  • At evaluere passende måder at præsentere data/​​resultater.
  • At skabe informative illustrationer af data som muliggør at der drages konklusioner.
  • At bekrive sine resultater og uddragne konklusioner kortfattet og præcist, og kritisk at evaluere andres tekster.

Se kursushjemmesiden på Absalon.

For at følge undervisningen anbefales et fagligt niveau svarende til de obligatoriske kurser på 1. og 2. år af en geovidenskabelig BSc-uddannelse på SCIENCE. Forudgående Python-kendskab er ikke nødvendig.
Undervisningen foregår ved forberedelse, forelæsninger i mindre omfang, fælles diskussioner, og i særlig grad via øvelser og arbejde med data. I øvelserne og i arbejdet med data vejledes de studerende i selvstændig brug/søgning i online kilder, så som fra google, stackoverflow, w3schools, geksforgeeks, og i brug af AI (f.eks. ChatGPT), samt i dokumentationen til anvendte Python-pakker (lær-at-lære). Hver enkelt deltager skriver gradvist i løbet af kurset sit eget kompendium til faget, som ved afslutningen af kurset vil udgøre den enkelte studerendes egen "Guide til datahåndtering ved brug af Python".
  • Kategori
  • Timer
  • Forelæsninger
  • 28
  • Forberedelse (anslået)
  • 150
  • Øvelser
  • 28
  • I alt
  • 206
Mundtlig
Løbende feedback i undervisningsforløbet
Feedback ved afsluttende eksamen (ud over karakteren)
Peerfeedback (studerende giver hinanden feedback)

Til den løbende udfærdigede version af kursusnoten vil kursusdeltagerne løbende modtage konstruktiv mundtlig feedback fra underviseren og skriftlig feedback via peergrade.io fra medstuderende. Deltagerne vil modtage skriftlig feedback og karaktér for den endelige version af deres egen afleverede kompendium.

Point
7,5 ECTS
Prøveform
Skriftlig aflevering, Løbende
Prøveformsdetaljer
Hver enkelt deltager skriver i løbet af kurset sit eget kompendium til faget, som ved afslutningen af kurset vil udgøre hver enkelts "Guide til datahåndtering ved brug af Python". Kompendiet afleveres ved afslutningen af kurset.
Hjælpemidler
Alle hjælpemidler tilladt
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Flere interne bedømmere.
Reeksamen

(Gen)aflevering af (eventuelt revideret) kompendium i form af deltagerens egen 'Guide til datahåndtering ved brug af Python', som skal afleveres inden reeksamensugen.

Kriterier for bedømmelse

Der henvises til målbeskrivelsen.