BIOSTATISTICA AVANZATA
Anno accademico e docente
Non hai trovato la Scheda dell'insegnamento riferita a un anno accademico precedente?
Ecco come fare >>
- English course description
- Anno accademico
- 2015/2016
- Docente
- ANDREA BENAZZO
- Crediti formativi
- 6
- Periodo didattico
- Secondo Semestre
- SSD
- SECS-S/01
Obiettivi formativi
- Il corso ha l'obiettivo di fornire allo studente competenze statistiche avanzate necessarie all'analisi dei fenomeni biologici complessi e all'interpretazione dei risultati provenienti dalla sperimentazione. In particolare, verranno approfondite le conoscenze teoriche dell'associazione lineare tra variabili numeriche e di come è possibile identificarla attraverso i metodi statistici più comuni. Inoltre verrà approfondito il tema della verosimiglianza, della regressione lineare tra due variabili numeriche, dei modelli lineari generali e di come queste metodologie siano utili per la previsione dell'effetto di determinati fattori sulle variabili biologiche di interesse. Allo studente verrà sottolineata l'importanza delle assunzioni delle varie metodologie di analisi e verranno date indicazioni sulle tecniche da adottare nel caso in cui queste non siano rispettate. Le conoscenze teoriche apprese verranno poi applicate a esempi biologici realistici eseguendo i calcoli a mano e verificandoli attraverso l'uso del software R al computer.
Tramite lezioni teoriche lo studente comprenderà la logica e il funzionamento delle principali metodologie statistiche utili all'interpretazione dei dati ottenuti per via sperimentale. Inoltre, tramite le attività di laboratorio al computer, lo studente apprenderà come applicare le conoscenze teoriche a dati biologici reali prodotti dall'attività di ricerca scientifica in diversi ambiti. Prerequisiti
- Non sono previste propedeuticità. Tuttavia, l'apprendimento degli elementi teorici di biostatistica avanzata richiede la conoscenza degli elementi principali di statistica di base. Saper utilizzare a livello base un computer è inoltre richiesto per l'apprendimento delle abilità pratiche da parte dello studente.
Contenuti del corso
- Il corso prevede 40 ore di lezioni frontali teoriche, corrispondenti a 5 crediti formativi, e 12 ore di lezioni pratiche, corrispondenti a 1 credito formativo di laboratorio, relative ai seguenti argomenti principali:
Introduzione a R (6 ore): descrizione dell'ambiente di analisi statistica e dei suoi comandi base, descrizione e creazione di vettori, matrici e data frame, funzioni aritmetiche semplici e complesse, creazione e modifica dei grafici più comuni.
Correlazione tra variabili numeriche (8 ore): Stima del coefficiente di correlazione lineare, verifica di ipotesi, Assunzioni principali, Correlazione non parametrica.
La regressione (8 ore): Concetto di regressione lineare, Qualità delle previsioni, Verifica delle ipotesi sulla pendenza, Assunzioni, Trasformazioni di variabile, Effetti degli errori di misura, Regressione non lineare.
Modelli lineari generali (8 ore): regressione e anova nel contesto dei modelli lineari generali, Testare l'effetto di uno o più fattori, L'analisi di disegni fattoriali, Le covariate, Le assunzioni
Metodi computazionali intensivi (8 ore): Verifica di ipotesi per simulazione, Il test di randomizzazione, il bootstrap
La verosimiglianza (8 ore): Il concetto di verosimiglianza, la stima di massima verosimiglianza, il test del rapporto di verosimiglianza
Esercizi di riepilogo (6 ore): Risoluzione guidata di numerosi esercizi riguardanti tutti gli argomenti del corso. Metodi didattici
- Il corso è strutturato in lezioni teoriche frontali e lezioni pratiche al computer in laboratorio multimediale. Sono previste 52 ore di lezione complessive divise in 40 ore di lezione teoriche e 12 ore di esercitazioni. Ogni lezione viene svolta dal docente in aula multimediale, con il supporto della proiezione di presentazioni power-point e della lavagna per la descrizione degli argomenti teorici. Per ogni argomento, allo studente viene descritto come applicare le conoscenze statistiche teoriche a degli esempi biologici pratici, attraverso la soluzione di alcuni problemi utilizzando il computer e il software R.
Modalità di verifica dell'apprendimento
- L'esame prevede una prova scritta e una prova pratica al computer. Per questo motivo l'esame si svolge normalmente nel laboratorio multimediale. La prova scritta prevede una combinazione di domande aperte (a risposta breve), domande a risposta multipla e piccoli esercizi che non richiedono l'uso di una calcolatrice, per un totale di 20 quesiti. In caso di risposta corretta alle domande aperte verranno attribuiti 2 punti mentre 1 punto verrà assegnato alle risposte a scelta multipla e agli esercizi. La prova pratica si svolge con l'utilizzo di un computer e del software R. Allo studente viene fornito un documento elettronico contenente la descrizione di due problemi biologici. Per ognuno di essi, alcune righe di testo introducono il problema, espongono i dati a disposizione dello studente e alcune domande vengono formulate. Attraverso l'uso del software R, lo studente dovrà applicare le conoscenze teoriche al problema biologico e rispondere alle domande nel documento elettronico. Per superare la parte pratica lo studente dovrà rispondere correttamente ad almeno metà dei quesiti. Il tempo a disposizione è di 1 ora per ogni prova.
Testi di riferimento
- M.C. Whitlock, D. Schluter Analisi dei dati biologici, Zanichelli, Bologna, 2010.
M. Pagano, K. Gauvreau, Biostatistica, Idelsono-Gnocchi, Napoli, 2003.
Le diapositive delle lezioni, e i dati degli esercizi da svolgere durante il corso, sono disponibili alla pagina del docente.