ASOA05025U Logikken i statistisk kontrol: Test af sociologiske forklaringer med regressionsanalyse - lukket for yderligere tilmeldinger

Årgang 2013/2014
Engelsk titel

The Logic of Statistical Control: Testing Sociological Explanations with Regression Analysis

Uddannelse
Valgfag BA+KA
Kursusindhold

Sociologien har en lang tradition for teoretisk informerede kvantitative undersøgelser. En af de mest anvendte forskningsstrategier inden for kvantitativ metode er statistisk kontrol. Statistisk kontrol muliggør undersøgelser af sammenhænge mellem to eller flere variable, når der er taget højde for sammenhængen med et tredje sæt af variable, nemlig kontrolvariablene. Sådan en forskningsstrategi er ikke kun et empirisk anliggende. Kontroltanken bør bruges aktivt til at udforske og teste teoretiske forklaringer og teoretisk udledte hypoteser, altså hvad man passende med Robert K. Merton kan kalde theories on the middle range, dvs. specialiserede forklaringer af afgrænsede sociale fænomener. Temaet for dette kursus er, hvordan et indgående kendskab til statistisk kontrol i regressionsanalyse kombineret med teoretisk-analytisk arbejde kan hjælpe den studerende til at undersøge sociologiske forklaringer af forskellige fænomener. Formålet er dermed at lære at bruge regressionsanalysen kreativt til at besvare afgrænsede sociologiske problemstillinger.

Informeret brug af statistisk kontrol i sociologien blev udviklet af Paul Lazarsfelds arbejder i efterkrigstiden på Columbia University (her især Lazarsfelds princip om elaborering). Selvom Lazarsfeld oprindeligt arbejdede med statistisk kontrol i krydstabeller, kan tanken nemt (faktisk overraskende nemt) overføres til regressionsanalyse, som bl.a. Herbert Simon, Otis Dudley Duncan, og Hubert M. Blalock har vist. Formålet med en analyse bliver at studere sammenhæng mellem A og B, udtrykt ved AxB. Denne sammenhæng kan man betinge på en tredje variabel, dvs. bryde sammenhængen ned med hensyn til en tredje variabel, C. Denne betingelse eller ”kontrol” udtrykkes ved AxB|C, dvs. vi studerer nu den betingede sammenhæng mellem A og B givet C. Kurset viser, hvordan denne relativt simple strategi kan bruges til teoretisk informeret empirisk forskning.

Regressionsanalysen som værktøj

Regressionsanalyse handler om sammenhænge mellem variable. I multipel regressionsanalyse, dvs. hvor der er mere end én forklarende variabel, siger man, at de estimerede sammenhænge er partielle. Disse partielle sammenhænge er udtrykt ved beta-koefficienter (regressionskoefficienter). Kurset handler om disse partielle sammenhænge eller effekter, nemlig hvad der sker, når man kontrollerer en sammenhæng mellem fx Y og X for en tredje variabel, Z, samt hvordan man kan bruge denne viden til at teste teoretiske forklaringer eller udsagn med. Kurset handler derfor om teoretisk informeret forlæns modelsøgning. Kurset forholder sig kritisk til baglæns modelsøgning, der kritiseres for at være ”data mining”, dvs. induktiv forskning, der ikke baserer sig på teoretiske udledte udsagn, der kan testes.

I kurset skal vi ind i regressionsmaskinen – ind i den logik, som statistisk kontrol baserer sig på. Derfor er dette lille kursus også en nødvendig og vigtig udbygning til de kvantitative grundkursers lærdom. Man får et praktisk kendskab til, hvordan regression kan kobles til sociologisk teori – her især i forhold til at teste teoretisk udledte udsagn.

Kurset gennemgår fire overordnede kontrolstrategier i regressionsanalyse:

1)      Test af en teori ved hjælp af statistisk kontrol af en sammenhæng mellem A og B, hvor man kontrollerer sammenhængen for en (eller flere) tredje variabel, C. der ligger bag sammenhængen og dermed muligvis forklarer den observerede sammenhæng. Spørgsmålet om spuriøse eller falske sammenhænge optræder her.

2)      Test af en teori ved hjælp af statistisk kontrol af en sammenhæng mellem A og B, hvor man kontrollerer sammenhængen for en (eller flere) tredje variabel, C der ligger mellem A og B og dermed medierer sammenhængen mellem A og B. Spørgsmålet om indirekte effekter optræder her.

3)      Test af to teoretisk udledte udsagn op mod hinanden ved typisk at udvikle en hypotese (og finde passende data), der kan skelne mellem to teoretiske udsagn. Denne strategi berøres kun kort, fordi den ofte er kompliceret og kræver gode data.

4)      Brug af interaktionseffekter til at teste heterogenitet i effekter. Hvordan man kan bruge interaktionseffekter til at vurdere om en sammenhæng af interesse varierer over forskellige grupper. Strategien berøres også kun kort, fordi studerende forventes allerede at kende til logikken bag interaktionseffekter.

Kurset fokuserer primært på de to første strategier ved at vise, hvordan regressionsanalyse kan bruges til at besvare hvorfor-spørgsmål og hvordan­-spørgsmål: Hvorfor observerer vi en sammenhæng mellem A og B? Skyldes det en bagvedliggende årsag, C? Hvordan hænger A og B sammen? Hvad er mekanismerne, C?

Kurset berører også nogle af de begrænsninger, der ligger i brugen af regressionsanalyse. Herbert Blumers kritik af brugen af "variablen" i sociologiske analyser diskuteres, ligesom nogle af de problemer, nyere forskning i identifikationen af kausal mekanismer med kvantitative data har påvist, tages op. Sidst diskuteres der andre muligheder for statistisk kontrol, her især brug af matching og vægtning.

Integrationen af teori og empiri: at teste teoretiske forklaringer

Kursets filosofiske forudsætninger er den løst definerede gren inden for sociologien, man kan kalde ”analytisk sociologi” eller ”positiv sociologi”. Denne form for sociologi anlægger et mere ”videnskabeligt” blik på socialforskning (uden at reducere det til et spørgsmål om naiv positivisme), her især spørgsmålet om udviklingen af teorier, der kan testes (dvs. eftervises) empirisk. Denne tradition står i modsætning til relativistiske tilgange, som fx forskellige former for socialkonstruktivisme. Den grundlæggende pointe, kurset fremsætter, er, at data ikke i sig selv tilvejebringer information om forventede sammenhænge mellem forskellige sociale fænomener. Derimod er det nødvendigt med teoretisk styring (dvs. et analytisk apparat) for at kunne fortolke sammenhængene i data.

Kurset stimulerer den studerende til at tænke sociologisk teori på en særlig måde, nemlig som theories on the middle range, hvormed Merton gav sociologien den rolle at udvikle og teste specialiserede forklaringer af afgrænsede sociale fænomener. Den teoretiske sociologi består af mange ”grand theories”, og disse teorier er generelt svære at eftervise, bl.a. fordi de er vagt formulerede eller så generelle, at de er svære at oversætte til empirisk observerbare størrelser. Kurset forsøger imidlertid at vise, at en mulig strategi i forhold til at få greb om disse teorier i forbindelse med at teste deres forklaringer er deduktivt at udlede udsagn på hypoteseform fra teorien. Den deduktive øvelse bliver altså den teoretiske øvelse, hvor teorien omsættes til få testbare udsagn, som kan angribes med regressionsanalyse.

Sidst forsøger kurset at vise (nok mere implicit end eksplicit), at der er en logisk komponent i videnskabelig forskning – også i sociologi – som hverken kan reduceres til en normativ begrundelse for valget af en teori til beskrivelsen af et fænomen eller kan siges at være forskellig for hhv. kvalitative og kvantitative analyser. En grundlæggende pointe er her, at en kvantitativ metode som regressionsanalysen rent faktisk kan besvare kvalitative spørgsmål, dvs. give svar på hvorfor og hvordan og ikke kun hvor meget. Her fremhæves det, at det måske i virkeligheden forholder sig sådan, at den kvantitative metode som oftest anvendt i sociologien har som sit formål at teste kvalitative hypoteser eller udsagn.

 

Målbeskrivelser

Hvad tager du med dig fra kurset?

  • At bruge regressionsanalyse på en fantasifuld måde til at undersøge sociologiske problemstillinger.
  • Stimuleret metodisk bevidsthed og forståelse af, hvor kraftigt (og vigtigt) et værktøj regressionsanalyse egentlig er.
  • Praktisk kendskab til forskellige teknikker i regressionsanalyse, som nemt kan overføres til egne opgaver, fx en større opgave som bacheloropgaven eller specialet.
  • Forudsætning for at kritisk at kunne forholde sig til en stor del af den empiriske sociologi, nemlig den, der bruger regressionsanalyse.

Målbeskrivelsen:
At give den studerende et praktisk kendskab til brugen af regressionsanalyse til empiriske test hypoteser udledt af sociologiske teorier. Faget lægger vægt på forståelsen af den måde, regressionsanalyse fungerer på, her især spørgsmålet om, hvordan ”statistisk kontrol” kan anvendes i teoretisk informerede modelsøgninger. I faget er der gjort plads til øvelser og eksempler, der giver den studerende en indsigt i den måde, regressionsanalyse kan anvendes på i sociologisk forskning. Kurset henvender sig direkte til den studerende, der står foran en større opgave, her især bacheloropgaven eller specialet, fordi kurset giver den studerende konkrete teknikker til at kunne teste teoretiske forklaringer, mekanismer og påstande med.

Foreløbig litteratur

Pensum [ca. 350 sider]

Aiken, Leona S. & Stephen G. West 1991: ”Introduction”. In: Multiple Regression: Testing and Interpreting Interactions. California: Sage: 1-8. [8 sider]

Blumer, Herbert 1956: ”Sociological Analysis and the ”Variable””. American Sociological Review, vol. 21 (6): 683-690. [8 sider]

Boudon, Raymond 1974: “Introducing a Third Variable”. In: The Logic of Sociological Explanation. Middlesex, England: Penguin: 67-97. [31 sider]

Boudon, Raymond 1981: “From description to explanation”. In: The Logic of Social Action: An Introduction to Sociological Analysis. London: Routledge & Kegan Paul: 134-147. [14 sider]

Boudon, Raymond 1991: “What Middle Range Theories are”. Contemporary Sociology, vol. 20 (4): 519-522. [4 sider]

Clarke, Kevin A. 2005: “The Phantom Menace: Omitted Variable Bias in Econometric Research”. Conflict Management and Peace Science, vol. 22 (4): 341-352. [12 sider]

Dougherty, Christopher 2007a: “Specification of Regression Variables: A Preliminary Skirmish”. In: Introduction to Econometrics. 3rd Edition. Oxford: Oxford University Press: 199-223. [34 sider]

Jæger, Mads Meier 2006: ”Kronik: Kvantitative metoder i dansk sociologi”. Dansk Sociologi, årg. 17 (3/4): 97-103. [7 sider]

King, Gary, Robert O. Keohane, and Sidney Verba: ”The Science in Science”. In: Designing Social Inquiry. Scientific Inference in Qualitative Research. NJ: Princeton University Press: 3-33. [31 sider]

Lazarsfeld, Paul F. 1955: “The Interpretation of Statistical Relations as a Research Operation”.

In: Lazarsfeld, Paul F. & Morris Rosenberg: The Language of Social Research. Glencoe, Illinois: The Free Press: 115-125. [11 sider]

Lieberson, Stanley 1985: “Control Variables”, in: Making it Count. The Improvement of Social Research and Theory. Berkeley: California University Press: 120-151. [32 sider]

Lieberson, Stanley 1991: “Small N’s and Big Conclusions: An Examination of the Reasoning in Comparative Studies Based on a Small Number of Cases”. Social Forces, vol. 70 (2): 307-320. [14 sider]

Pratt, John W. & Robert Schlaifer 1988: “On the Interpretation and Observation of Laws”. Journal of Econometrics, vol. 39: 23-52. [30 sider]

Popper, Karl 2007 [1957]: “The Unity of Method”. In: The Poverty of Historicism. London: Routledge: 120-132. [13 sider]

Simon, Herbert A. 1954: “Spurious Correlation: A Causal Interpretation”. Journal of the American Statistical Association, vol. 49 (267): 467-479. [14 sider]

Stinchcombe, Arthur 1968: “Introduction”. In: Constructing Social Theories. New York: Harcourt, Brace and World, Inc.: 3-13. [11 sider]

Stinchcombe, Arthur 1968: “Fundamental Forms of Scientific Inference”. In: Constructing Social Theories. New York: Harcourt, Brace and World, Inc.: 15-28. [14 sider]

Stolzenberg, Ross 2004: "Multiple Regression Analysis", in: Bryman, Alan & Melissa Hardy (eds.): Handbook of Data Analysis. London: Sage: 165-207. [43 sider]

NB! Der vil også være supplerende litteratur.

Forudsætninger: Afsluttet grundkursus i statistik på bachelordelen. Kendskab til krydstabulering, regressionsanalyse og i nogen grad statistisk kontrol (dvs. spørgsmålet om spuriøse sammenhænge). Matematiske forkundskaber er ikke et krav (alle matematiske udsagn eller opskrivninger i undervisningen vil altid blive beskrevet med ord).

Statistik-pakke: Kurset anvender udelukkende Stata til eksempler og øvelser.
Forelæsninger kombineret med øvelser i Stata.
Kurset fungerer også som liniefag for specialiseringsretningen: Metode

SAMF IT har oprettet en side for installering af programmer på egne computere: http:/​​​/​​​samf-it.ku.dk/​​​stud/​​​programmer
  • Kategori
  • Timer
  • Eksamen
  • 60,75
  • Eksamensforberedelse
  • 60,75
  • Forelæsninger
  • 16
  • I alt
  • 137,50
Point
5 ECTS
Prøveform
Løbende bedømmelse
Aktiv undervisningsdeltagelse
Bedømmelsesform
bestået/ikke bestået
Censurform
Ingen ekstern censur
Flere interne bedømmere
Eksamensperiode
Aflevering af eksamensopgaver: Kl. 12.00 i sekretariatet (16.1.34) Datoen er 1. september 2014.
Kriterier for bedømmelse
Se målbeskrivelsen
Point
5 ECTS
Prøveform
Skriftlig aflevering
Omfang: Max 7½ side á 2400 tegn (inkl. mellemrum). Ved gruppebesvarelser tillægges 50 % á 2400 tegn pr. ekstra studerende.
Bemærk: Ved gruppebesvarelser skal den enkelte studerendes bidrag kunne konstateres.
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Flere interne bedømmere
Eksamensperiode
Aflevering af eksamensopgaver: Kl. 12.00 i sekretariatet (16.1.34) Datoen er 1. september 2014.
Kriterier for bedømmelse
Se målbeskrivelse