HBAPS001EU Sprog, tale og statistik

Årgang 2026/2027
Engelsk titel

Language, Speech, and Statistics

Uddannelse

Tilvalgsfagpakken i AI, programmering og sprogteknologi

 

Tilvalgsfagpakkerne er kun åbne for HUM-studerende fra Københavns Universitet.

Kursusindhold

Kurset giver en introduktion til grundlæggende begreber og metoder inden for sprogvidenskab og sprogrelevant statistik. Den studerende opnår en forståelse af, hvordan talesprogsdata opbygges og analyseres, herunder prosodiske træk som lydstruktur, tryk, intonation og rytme. Kurset giver også en indføring i, hvordan man arbejder med sproglige datasæt til bl.a. taleteknologi – fx korpora – og hvordan man anvender statistik til at undersøge mønstre i tale og tekst. Kurset understøtter arbejdet med praksisnære problemstillinger i forbindelse med automatiseret talegenkendelse og sproglig databehandling og udgør et vigtigt fundament for forståelsen af NLP- og AI-værktøjer.

Målbeskrivelser

Ved undervisningens afslutning kan den studerende demonstrere:

 

Viden om og forståelse af

  • prosodiske fænomener i talt sprog, herunder tryk, intonation og assimilation
  • sammenhænge mellem tale og skrift og fonem-grafem-korrespondancer
  • grundlæggende statistiske begreber som frekvens, gennemsnit, spredning og statistik inferens (fx t-test og regressionsanalyse),
  • opbygning og brug af sproglige datasæt og ressourcer.

 

Færdigheder i at

  • beskrive og analysere udvalgte træk ved talt sprog og kunne demonstrere det mundtligt
  • anvende statistiske metoder til at analysere sproglige data,
  • gennemføre enkle korpusundersøgelser
  • identificere relevante analysemetoder til at undersøge sproglige problemstillinger relateret til taleteknologi.

 

Kompetencer til at

  • kombinere viden om tale og statistik i arbejdet med sprogteknologiske opgaver
  • evaluere kvaliteten af sproglige datasæt og det sproglige output fra taleteknologiske værktøjer
  • løse opgaver inden for fx analyse og udvikling af talesprogsværktøjer,
  • reflektere over fordele og ulemper ved statistisk og sprogvidenskabelig analyse i forbindelse med taleteknologiske løsninger.

Pensum fastlægges af underviseren.

Holdundervisning med aktiv inddragelse af de studerende, herunder bl.a. øvelser, som de studerende vil løse i forbindelse med undervisningen med vejledning af underviseren, eller oplæg fra de studerende.

Praksissamarbejde med relevant organisation som arbejder aktivt med dansk taleteknologi, og som kan fremlægge cases som de studerende kan arbejde med i undervisningen.
  • Kategori
  • Timer
  • Holdundervisning
  • 84
  • Forberedelse (anslået)
  • 210
  • Studiegrupper
  • 102
  • Eksamen
  • 16,5
  • I alt
  • 412,5
Mundtlig
Kollektiv
Løbende feedback i undervisningsforløbet
Point
15 ECTS
Prøveform
Hjemmeopgave , 4-5 ns. Der gives 48 timer til besvarelsen.
Mundtlig prøve, 30 min. inkl. votering. Der gives ingen forberedelse til den mundtlige prøve.
Prøveformsdetaljer
Fri mundtlig prøve og bunden hjemmeopgave.

Gruppeprøvebestemmelser: Den mundtlige prøve kan kun aflægges individuelt. Hjemmeopgaven kan aflægges individuelt eller som gruppeprøve (maks. 3 studerende) med individuel bedømmelse. Ved gruppeprøver skal hver enkelt deltagers bidrag være en afrundet helhed, der er identificeret og kan bedømmes for sig. Deltagernes fællesbidrag af den samlede besvarelses omfang må ikke overstige 50 %.
Hjemmeopgavens omfang ved gruppeprøve: 6-8 ns. (2 studerende), 8-11 ns. (3 studerende).

Vægtning: Den mundtlige prøve og hjemmeopgaven vægter hver 50% i bedømmelsen.
Hjælpemidler
Alle hjælpemidler tilladt

For regler om generativ kunstig intelligens, se Studieinformation.

Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Reeksamen

Samme som den ordinære prøve.

Kriterier for bedømmelse

Se målbeskrivelser.