ASTK15747U Seminar: Political Data Science

Årgang 2017/2018
Engelsk titel

Seminar: Political Data Science

Kursusindhold

I 2008 lancerede Google sin service Google Flu Trends, der gjorde Google i stand til at forudsige influenza-udbrud flere uger før nationale sundhedsmyndigheder var i stand til at identificere samme udbrud. Google Flu Trends er et eksempel på, hvordan data science kan bruges til at få værdifulde indsigter fra data, der kan danne baggrund for politisk handling. 

Data science er en videnskab såvel som en kunst, hvor formålet er at ekstrahere viden og indsigter fra data. Processen består både i at hente, transformere, visualisere og analysere data – ofte med redskaber, som ikke indgår i den almindelige politologiske værktøjskasse. Formålet med kurset er at klæde de studerende på til selv at give sig i kast med nogle af de metoder og værktøjer, som er nybrud i politologien, fx i forbindelse med et speciale.

 

Centrale emner i kurset vil være:

  1. Hente data: Skaffe data fra alsidige datakilder såsom med scraping og API’er

  2. Præ-processering: Gøre data tidy og klar til analyse ved transformation af data

  3. Visualisering: Præsentere data på en intuitiv og appetitvækkende facon

  4. Statistisk læring: Klassificere og forudsige om data ved brug af især superviseret maskinlæring, såsom Random Forest og Gradient Boosted Trees

Kurset vil indeholde en blanding af teori og redskaber, og den tekniske del af kurset vil foregå i R.

Teorien vil blandt andet omfatte forskelle mellem kausalestimation og prædiktion, centrale koncepter i maskinlæring samt refleksioner om data science, herunder hvorfor Google har valgt at nedlægge Google Flu Trends. En del af eksemplerne i kurset vil tage udgangspunkt i mit eget speciale, hvor jeg anvendte maskinlæring til at forudsige og målrette tiltag imod uddannelsesfrafald på Professionshøjskolen Metropol.

Redskaberne i kurset vil blandt andet være centrale R-pakker såsom dplyr, ggplot2 og magrittr. I kurset stiftes også bekendtskab med at hente data ved at benytte API’er.  

Kurset kan både stå alene og supplere kurset Videregående kvantitative metoder i studiet af politisk adfærd.

Målbeskrivelser

Kursets målsætning er at klæde den studerende på til at kunne:

  • Håndtere og transformere data i R

  • Forklare væsensforskellene mellem kausalestimation og prædiktion

  • Forklare centrale maskinlæringskoncepter

  • Formulere og designe et prædiktionsproblem

  • Anvende fagets metoder på et selvvalgt emne

Kursets litteratur vil hovedsageligt bestå af kapitler fra lærebøger samt artikler. Særligt vil følgende to lærebøger stå centralt:

  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112). New York: Springer.

  • Wickam, Hadley & Grolemund, Garrett (2016). R for Data Science. O’Reilly Media.

 

En del af litteraturen vil desuden udgøres af dokumentationen for anvendte pakker i R mv.

En detaljeret læseplan følger ved kursusstart. 

Det forudsættes, at man har gennemført de obligatoriske metodekurser på bacheloruddannelsen i statskundskab, eller tilsvarende.
Det er ikke en forudsætning at have kendskab til R i forvejen, men det er en forudsætning at have mod på at arbejde i R.
Undervisningen består af holdundervisning, hvor pensum bliver gennemgået. Indholdet i undervisningen vil både blive formidlet med slides samt eksempler i R.
  • Kategori
  • Timer
  • Holdundervisning
  • 28
  • I alt
  • 28
Point
7,5 ECTS
Prøveform
Skriftlig aflevering
Individuel Seminaropgave
Krav til indstilling til eksamen
  • En betingelse for at bestå seminarer er, at den studerende har deltaget aktivt i seminaret, dels gennem tilstedeværelse i minimum 75% af undervisningen og dels gennem aktiv deltagelse

Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Kriterier for bedømmelse
  • Karakteren 12 gives for den fremragende præstation, dvs. hvor den studerende med ingen eller få og uvæsentlige mangler og på selvstændig og overbevisende måde er i stand til at indfri målbeskrivelsen for udbuddet.
  • Karakteren 7 gives for den gode præstation, dvs. hvor den studerende, om end med adskillige mangler, på sikker vis er i stand til at indfri målbeskrivelsen for udbuddet.
  • Karakteren 02 gives for den tilstrækkelige præstation, dvs. den minimalt acceptable præstation, hvor den studerende kun usikkert, mangelfuldt og/​eller uselvstændigt er i stand til at indfri målbeskrivelsen for udbuddet.