Computational Data Analysis

Nye og udfordrende datakilder så som microarrays og hyperspectral billeder har skabt en enorm fremgang i statistisk modellering i de sidste årtier. Formålet med dette kursus er at give en teoretisk og anvendt introduktion til flere metoder, der gør det muligt at analysere og forstå sådanne data. Disse metoder er også anvendelige på mere traditionelle datasæt, hvor de færdige modeller kan give et bedre resultat og/eller være lettere at fortolke.

Vi vil holde et fokus på hands-on anvendelse af metoderne og begrænse teorien til de mest nødvendige for at bruge metoderne korrekt.

På grund af det brede indhold på dette kursus vil tempoet være relativt højt. Der er dog masser af plads til øvelser og diskussioner, så de studerende er i stand til at gennemføre kurset på trods af forskellige erfaringer.

Øvelser vil primært være baseret på at køre og ændre Matlab-, Python- eller R-programmer (vælg det programmeringssprog, du foretrækker).

Tidligere erfaring med programmering er en forudsætning.

Installer Matlab, R eller Python på din computer inden kursusstart. DTU tilbyder en gratis Matlab-studerende licens.

Praktisk information

Dato: 2022 (TBS)
Varighed: 8:00 - 17:00
Sted: DTU, Kgs. Lyngby
Sprog: Engelsk
Tilmeldingsfrist: 1 måned før
Pris: 10.600 DKK ex. VAT /excl. moms

TILMED DIG HER - Ved tilmelding sendes faktura

Har du spørgsmål?

Kursusform

Dette kursus gives som et kursus af en uges varighed i august (24.-28. August 2020) ved Danmarks Tekniske Universitet, eller om nødvendigt vil kurset køre online i år. Derefter bruger de studerende en måned på at anvende metoderne til egne data. Kurset er et 5 ECTS-kursus. Det er åbent både for alle ph.d.-studerende og for alle andre via Åben Universitet / DTU-efteruddannelse. For information om, hvordan du ansøger via Åben Universitet / DTU Efteruddannelse, se dette link.

Kursusmateriale

Kursusmaterialet består af kapitler fra elektroniske lærebøger og dokumenter. De fleste forelæsninger vil henvise til bogen "Elements of Statistical Learning" (ESL) af Hastie, Tibshirani og Friedman. Denne bog er frit tilgængelig fra dette link. Henvisninger til andet materiale vil blive givet på CampusNet.

Skema for forelæsningerne

Forelæsninger og øvelser er i moduler på en halv dag for hvert emne (8-12 og 13-17) og finder sted på DTU, Lyngby Campus. Vi arrangerer frokost fra 12-13, men studerende skal betale deres egen frokost. Skemaet herunder kan blive underlagt mindre ændringer - indholdet vil være: cross-validation, model selection, bias-variance trade-off, over and under fitting, sparse regression, sparse classification, logistic regression, linear discriminant analysis, clustering, classification and regression trees, multiple hypothesis testing, principal component analysis, sparse principal component analysis, support vector machines, neural networks, self-organizing maps, random forests, boosting, non-negative matrix factorization, independent component analysis, archetypical analysis, og sparse coding.

Eksamen

Den studerende skal deltage i kurset og aflevere en lille rapport om et eller flere af kursets emner relateret til de studerendes egen forskning eller arbejde. Karaktererne er bestået / ikke bestået. Deadline for rapporten er en måned fra det sidste forelæsning (dvs. slutningen af september).