Salta ai contenuti. | Salta alla navigazione

Strumenti personali

BIOSTATISTICA AVANZATA

Anno accademico e docente
Non hai trovato la Scheda dell'insegnamento riferita a un anno accademico precedente? Ecco come fare >>
English course description
Anno accademico
2015/2016
Docente
ANDREA BENAZZO
Crediti formativi
6
Periodo didattico
Secondo Semestre
SSD
SECS-S/01

Obiettivi formativi

Il corso ha l'obiettivo di fornire allo studente competenze statistiche avanzate necessarie all'analisi dei fenomeni biologici complessi e all'interpretazione dei risultati provenienti dalla sperimentazione. In particolare, verranno approfondite le conoscenze teoriche dell'associazione lineare tra variabili numeriche e di come è possibile identificarla attraverso i metodi statistici più comuni. Inoltre verrà approfondito il tema della verosimiglianza, della regressione lineare tra due variabili numeriche, dei modelli lineari generali e di come queste metodologie siano utili per la previsione dell'effetto di determinati fattori sulle variabili biologiche di interesse. Allo studente verrà sottolineata l'importanza delle assunzioni delle varie metodologie di analisi e verranno date indicazioni sulle tecniche da adottare nel caso in cui queste non siano rispettate. Le conoscenze teoriche apprese verranno poi applicate a esempi biologici realistici eseguendo i calcoli a mano e verificandoli attraverso l'uso del software R al computer.
Tramite lezioni teoriche lo studente comprenderà la logica e il funzionamento delle principali metodologie statistiche utili all'interpretazione dei dati ottenuti per via sperimentale. Inoltre, tramite le attività di laboratorio al computer, lo studente apprenderà come applicare le conoscenze teoriche a dati biologici reali prodotti dall'attività di ricerca scientifica in diversi ambiti.

Prerequisiti

Non sono previste propedeuticità. Tuttavia, l'apprendimento degli elementi teorici di biostatistica avanzata richiede la conoscenza degli elementi principali di statistica di base. Saper utilizzare a livello base un computer è inoltre richiesto per l'apprendimento delle abilità pratiche da parte dello studente.

Contenuti del corso

Il corso prevede 40 ore di lezioni frontali teoriche, corrispondenti a 5 crediti formativi, e 12 ore di lezioni pratiche, corrispondenti a 1 credito formativo di laboratorio, relative ai seguenti argomenti principali:
Introduzione a R (6 ore): descrizione dell'ambiente di analisi statistica e dei suoi comandi base, descrizione e creazione di vettori, matrici e data frame, funzioni aritmetiche semplici e complesse, creazione e modifica dei grafici più comuni.
Correlazione tra variabili numeriche (8 ore): Stima del coefficiente di correlazione lineare, verifica di ipotesi, Assunzioni principali, Correlazione non parametrica.
La regressione (8 ore): Concetto di regressione lineare, Qualità delle previsioni, Verifica delle ipotesi sulla pendenza, Assunzioni, Trasformazioni di variabile, Effetti degli errori di misura, Regressione non lineare.
Modelli lineari generali (8 ore): regressione e anova nel contesto dei modelli lineari generali, Testare l'effetto di uno o più fattori, L'analisi di disegni fattoriali, Le covariate, Le assunzioni
Metodi computazionali intensivi (8 ore): Verifica di ipotesi per simulazione, Il test di randomizzazione, il bootstrap
La verosimiglianza (8 ore): Il concetto di verosimiglianza, la stima di massima verosimiglianza, il test del rapporto di verosimiglianza
Esercizi di riepilogo (6 ore): Risoluzione guidata di numerosi esercizi riguardanti tutti gli argomenti del corso.

Metodi didattici

Il corso è strutturato in lezioni teoriche frontali e lezioni pratiche al computer in laboratorio multimediale. Sono previste 52 ore di lezione complessive divise in 40 ore di lezione teoriche e 12 ore di esercitazioni. Ogni lezione viene svolta dal docente in aula multimediale, con il supporto della proiezione di presentazioni power-point e della lavagna per la descrizione degli argomenti teorici. Per ogni argomento, allo studente viene descritto come applicare le conoscenze statistiche teoriche a degli esempi biologici pratici, attraverso la soluzione di alcuni problemi utilizzando il computer e il software R.

Modalità di verifica dell'apprendimento

L'esame prevede una prova scritta e una prova pratica al computer. Per questo motivo l'esame si svolge normalmente nel laboratorio multimediale. La prova scritta prevede una combinazione di domande aperte (a risposta breve), domande a risposta multipla e piccoli esercizi che non richiedono l'uso di una calcolatrice, per un totale di 20 quesiti. In caso di risposta corretta alle domande aperte verranno attribuiti 2 punti mentre 1 punto verrà assegnato alle risposte a scelta multipla e agli esercizi. La prova pratica si svolge con l'utilizzo di un computer e del software R. Allo studente viene fornito un documento elettronico contenente la descrizione di due problemi biologici. Per ognuno di essi, alcune righe di testo introducono il problema, espongono i dati a disposizione dello studente e alcune domande vengono formulate. Attraverso l'uso del software R, lo studente dovrà applicare le conoscenze teoriche al problema biologico e rispondere alle domande nel documento elettronico. Per superare la parte pratica lo studente dovrà rispondere correttamente ad almeno metà dei quesiti. Il tempo a disposizione è di 1 ora per ogni prova.

Testi di riferimento

M.C. Whitlock, D. Schluter Analisi dei dati biologici, Zanichelli, Bologna, 2010.
M. Pagano, K. Gauvreau, Biostatistica, Idelsono-Gnocchi, Napoli, 2003.
Le diapositive delle lezioni, e i dati degli esercizi da svolgere durante il corso, sono disponibili alla pagina del docente.