Big data och analys av högdimensionella data


Aktuellt kursbeskrivning finns i kursplanen.


Moment 1 (2 hp):
Teori.
I momentet diskuteras vad som karakteriserar big data och högdimensionella data, inkluderande en historisk bakgrund och exempel på tillämpningar. Regressionsanalys inklusive maximum likelihood- och minsta kvadratmetoderna repeteras. Det generella klassificeringsproblemet introduceras. Mål med klassificering och hur prestanda mäts diskuteras. Vidare ingår valideringsmetoder, inklusive korsvalidering och utvärdering med hjälp av oberoende testdata. Teori för, och tillämpningar av logistisk regressionsanalys samt linjär och kvadratisk diskriminantanalys (LDA respektive QDA) tas upp. Variabelselektion för klassificeringsproblem, ridge regression, lasso, och principalkomponentanalys (PCA) behandlas, samt hur dessa metoder kan användas tillsammans med logistisk regression, LDA och QDA. Programspråket R och intressanta programbibliotek introduceras, inkluderande diskussion av ett genomarbetat exempel innehållande variabelselektion, klassificering och evaluering. Vidare ingår metoderna "K-nearest neighbour" (KNN), "system vector machines" (SVM) och "random forest". Det generella klusteranalysproblemet introduceras. Mål med klusteranalys och hur prestanda (robusthet) mäts diskuteras. I samband med detta behandlas hierarkisk klusteranalys, "k-means" och "self-organizing maps" (SOM).

Moment 2 (5.5 hp)
Datorlaborationer.
I momentet ingår analys av flera datamaterial med hjälp av de i kursen ingående statistiska metoderna. Analyserna utförs i programspråket R. I momentet ingår omfattande skriftliga redogörelser av analyserna och dess resultat. För tillträde till kursen krävs 90 hp inkluderande 12 hp matematisk statistik och 7,5 hp programmeringsmetodik eller motsvarande kunskaper. Engelska A och svenska för grundläggande behörighet för högskolestudier (om kursen ges på svenska).
Info
Institutionen för matematik och matematisk statistik
Poäng 7,5
Nivå Avancerad
Kod 5MS062

Kategorier
Profilkurs 7,5
Avancerade kurser 7,5

Spår