ASOA15043U Anvendt data-mining: Klassifikation af variabler og individer (SOMMER 2018)
Applied Data Mining: Grouping Variables and Individuals (SUMMER 2018)
BA/KA valgfag
Studerende på BA 2005 studieordningen (10 ECTS)
Studerende på KA 2015 studieordningen (7,5 ECTS)
Kurset er IKKE åbent for studerende på BA 2016
studieordningen.
Fagpakke (KA 2015):
Velfærd, ulighed og mobilitet/Welfare, inequality and mobility
Viden, organisation og politik/Knowledge, organisation and politics
Kultur, livsstil og hverdagsliv/Culture, lifestyle and everyday
life
OBS
Vi forventer, at deltagerne på kurset inden kursusstart har læst
pensum og dermed forberedt sig til kurset i omfanget af ca 100
timer.
Deskriptive metoder vinder større og større udbredelse i
sociologien. Nogle snakker endda om en ”deskriptiv vending”. I den
kvantitative sociologi findes der et hav af deskriptive værktøjer,
som giver forskeren mulighed for at overskue relativt komplekse
data. Populært taler man om ”data mining”, hvilket kan oversættes
til en eksplorativ kortlægning (”mining”) af sine data med henblik
på at identificere overordnede, systematiske mønstre i data. Disse
mønstre kan i sig selv være informative for sociologen, ligesom de
kan være genstand for videregående analyser, der forsøger at
forklare, hvorfor mønstrene ser ud, som de gør.
Kurset giver en praktisk introduktion til to udbredte
deskriptive metoder: Faktoranalyse (FA) og latent klasseanalyse
(LKA). Begge metoder kan motiveres ud fra samme underliggende
princip (se nedenfor), men har forskellige indholdsmæssige formål.
Hvor FA forsøger at gruppere variable, der ligner hinanden,
forsøger LKA at gruppere individer, der ligner hinanden. Det lyder
umiddelbart som to meget forskellige tilgange, men i virkeligheden
er det to sider af samme sag.
Det fælles underliggende princip for de to metoder går ofte
under betegnelsen ”målemodeller” eller ”modeller for latente
variable” (på engelsk hhv. ”measurement models” eller ”latent
variable models”). Princippet går kort sagt ud på at måle et
fænomen indirekte gennem en række indikatorer, som vi har i vores
data. Med andre ord er fænomenet latent, dvs. det kan ikke
observeres direkte (heraf latent variabel). Eksempler kan være
solidaritet, grundholdninger eller lykke. Disse størrelser er
vigtige teoretiske begreber i samfundsvidenskaben, men man kan ikke
gå ud observere dem direkte. Derimod kan man observere dem
indirekte gennem en række indikatorer på fx det, at være lykkelig.
I en FA anvender man disse indikatorer til at ”måle” det latente
fænomen med. Tilsvarende kan man forestille sig, at man gerne vil
opdele sin stikprøve (eller den population, som stikprøven er
udtrukket fra) i to eller flere grundlæggende typer. Det kan fx
være sociale klasser eller forbrugersegmenter. Har man fx indsamlet
data på en række indikatorer på personers madforbrug, kan man
anvende LKA på disse indikatorer til at gruppere personerne i nogle
grundlæggende typer eller segmenter ud fra, hvor meget de ligner
hinanden i deres madforbrug (forbrugersegmenter)
I både FA og LKA er det latente fænomen en variabel. I FA er
variablen kontinuert. I LKA er den diskret. Herudover anvendes FA
på kontinuerte eller ordinale indikatorer, mens LKA anvendes på
diskrete (ordinale eller nominale) indikatorer. Med andre ord er
det metodiske princip (at indirekte måle en latent variabel) det
samme i det to metoder, men skalatyperne varierer. Dog findes der
udvidelser af metoderne, hvor denne strenge opdeling ikke længere
holder (disse berøres overfladisk på kurset).
Kursets hovedvægt ligger på det praktiske aspekt af FA og LKA. Med andre ord vil kurset prioterere praktiske øvelser i Stata, ligesom den studerende kan få mulighed for at arbejde på egne data (hvis relevant). Kurset vil dog også præsentere teorien bag målemodeller (latente og manifeste variable), ligesom kurset vil berøre den ophedede debat om den rolle, hhv. beskrivelse og forklaring bør spille i sociologien. Sidst vil kurset berøre, hvordan man kan arbejde videre med de ”beskrivelse”, som enten en FA eller LKA producerer.
VIDEN
Den studerende skal kunne redegøre for teorien bag målemodeller, hvilket involverer redegørelse for
- data-mining som forskningsstrategi
- latente og manifeste variable
- betinget uafhængighed
- principperne bag faktoranalyse
- principperne bag latent klasseanalyse
Herudover skal den studerende kunne forklare, hvordan
ovenstående principper kan anvendes i sociologiske undersøgelser.
Sidst skal den studereende kunne reflektere over muligheder og
begrænsninger ved anvendelsen af data-mining i sociologisk
forskning.
FÆRDIGHEDER
Faget giver den studerende et praktisk kendskab til brugen af faktoranalyse og latent klasseanalyse i statistikprogrammet Stata. Den studerende skal kunne
- udføre en faktoranalyse, herunder fortolke de relevante parametre i relation til en given sociologisk problemstilling.
- udføre en latent klasseanalyse, herunder fortolke de relevante parametre i relation til en given sociologisk problemstilling.
- kritisk vurdere sine empiriske resultater i relation til en
given problemstilling på en måde, der signalerer forståelse af
muligheder og begrænsninger ved anvendelse af data-mining i
sociologien.
KOMPETENCER
Efter endt undervisning skal den studerende kunne
- tilegne sig videregående kvantitative metoder som fx kvasi-eksperimentelle metoder og multilevel-analyse.
- omsætte sin viden og færdigheder i analyser ved fx at kunne planlægge og gennemføre rapporter, der anvender faktoranalyse eller latent klasseanalyse.
Kombineret elektronisk og fysisk kompendium.
Omfang af pensum:
7,5 ECTS: 600-700 sider.
10 ECTS: 800 sider.
Bemærk at kurset anvender udelukkende statistikprogrammet Stata til eksempler og øvelser.
Bemærk at man skal have sin egen bærbare computer med (med den nyeste version af Stata installeret).
Kurset har adgangsbegrænsning.
Ordinær tilmeldingsperiode til sommerskole kurser er fra 15. november til 1. december. Bliver kurset fyldt her, vil det IKKE blive udbudt igen ved eftertilmeldingsperioden fra 15. maj - 1. juni.
VEJLEDENDE ARBEJDSBELASTNING
Antallet af undervisningstimer er ens for både 7,5 og 10 ECTS
10 ECTS
Forelæsninger: 28
Undervisningsforberedelse: 130
Øvelser: 104
Projektarbejde: 0 (hvis der er 0 i en fjernes linjen)
Eksamensforberedelse: 11
I alt: 275
- Kategori
- Timer
- Eksamensforberedelse
- 74
- Forberedelse
- 75
- Forelæsninger
- 28
- Undervisningsforberedelse
- 20
- Øvelser
- 9
- I alt
- 206
Kursets består af en række praktiske øvelser. Studerende giver feedback til hinanden på deres besvarelser af øvelserne. Feedbacken sker i undervisningen i grupper af tre, hvor en studerende giver feedback, en anden modtager og en tredje noterer feedbackens indhold og modtagerens respons (feedback-triader). Disse roller går på tur, sådan at alle i gruppen påtager sig hver rolle. Aktiviteten afsluttes ved en opsummering i plenum.
Efterårskurser: Tilmeldingsperioden er 15. maj - 1. juni.
Forårskurser: Tilmeldingsperioden er 15. november – 1. december
Sommerskole-kurser kan tilmeldes i begge periode (meritstuderende
dog kun pr. 1. juni.)
Tilmelding til undervisning medfører automatisk tilmelding til
eksamen.
Meritstuderende skal tilmelde sig via en særlig en
ansøgningsformular:
klik
her
- Point
- 7,5 ECTS
- Prøveform
- Skriftlig afleveringIndividuel/gruppe. Ved en skriftlig opgave forstås en opgave, der besvarer et eller flere stillede spørgsmål. Der eksamineres her på baggrund af fagets pensum, dvs. den litteratur, der er fastlagt af underviseren. Den skriftlige opgave må maximalt fylde 10 sider. Ved gruppebesvarelser tillægges 5 sider pr. ekstra studerende. Se detaljer for prøveform i studieordningen og den generelle eksamensvejledning på KUnet.
- Krav til indstilling til eksamen
Sociologistuderende skal være indskrevet på KA 2015 studieordningen, for at kunne tage denne eksamen.
- Bedømmelsesform
- 7-trins skala
- Censurform
- Ingen ekstern censur
- Eksamensperiode
Dato samt tidspunkt for aflevering kan ses på KUnet, www.kunet.dk.
For meritstuderende og udenlandske studerende findes listen over afleveringsdatoer på Sociologisk Instituts hjemmeside: http://www.soc.ku.dk/uddannelser/meritstuderende/eksamen/ og http://www.soc.ku.dk/english/education/exams/- Reeksamen
Eksamensformen ved reeksamen er den samme som ved ordinær eksamen.
OBS! Eksamensformen ”aktiv deltagelse” er altid afløsningsopgave ved re-eksamen.
Kriterier for bedømmelse
Se målbeskrivelsen.
- Point
- 10 ECTS
- Prøveform
- Skriftlig afleveringIndividuel/gruppe. Ved en skriftlig opgave forstås en opgave, der besvarer et eller flere stillede spørgsmål. Der eksamineres her på baggrund af fagets pensum, dvs. den litteratur, der er fastlagt af underviseren. Den skriftlige opgave må maximalt fylde 10 sider. Ved gruppebesvarelser tillægges 5 sider pr. ekstra studerende. Se detaljer for prøveform i studieordningen og den generelle eksamensvejledning på KUnet.
- Krav til indstilling til eksamen
Sociologistuderende skal være indskrevet på BA 2005 studieordningen for at kunne tage denne eksamen.
- Bedømmelsesform
- 7-trins skala
- Censurform
- Ingen ekstern censur
- Eksamensperiode
Dato samt tidspunkt for aflevering kan ses på KUnet, www.kunet.dk.
For meritstuderende og udenlandske studerende findes listen over afleveringsdatoer på Sociologisk Instituts hjemmeside: http://www.soc.ku.dk/uddannelser/meritstuderende/eksamen/ og http://www.soc.ku.dk/english/education/exams/- Reeksamen
Eksamensformen ved reeksamen er den samme som ved ordinær eksamen.
OBS! Eksamensformen ”aktiv deltagelse” er altid afløsningsopgave ved re-eksamen.
Kriterier for bedømmelse
Se målbeskrivelsen.
Kursusinformation
- Sprog
- Dansk
- Kursuskode
- ASOA15043U
- Point
- Se eksamensbeskrivelse
- Niveau
- KandidatBachelor tilvalg,Kandidat tilvalg
- Varighed
- Placering
- Sommer
- Skemagruppe
- Undervisningen ligger i uge 34
Mandag 9-15.30
Tirsdag 10-15.30
Onsdag 10-15.30
Torsdag 10-15.30
Fredag 9-15.30
Lokale: CSS 35-3-13 - Studienævn
- Sociologisk studienævn
Udbydende institut
- Sociologisk Institut
Kursusansvarlige
- Kristian Bernt Karlson (3-6e656e43767266316e7831676e)
Undervisere
Kristian Bernt Karlson, e-mail: kbk@soc.ku.dk