BIOSTATISTICA
Anno accademico e docente
Non hai trovato la Scheda dell'insegnamento riferita a un anno accademico precedente?
Ecco come fare >>
- English course description
- Anno accademico
- 2022/2023
- Docente
- GIORGIO BERTORELLE
- Crediti formativi
- 6
- Periodo didattico
- Primo Semestre
- SSD
- SECS-S/01
Obiettivi formativi
- Biostatistica è il primo corso della laurea in Biologia nel quale gli studenti si confronteranno con l’analisi dei dati biologici prodotti da un esperimento oppure raccolti in natura. L’obiettivo principale è di capire prima di tutto l’importanza della statistica nello studio dei fenomeni biologici, e di fornire quindi le basi per impostare le analisi appropriate per quantificare l’incertezza e confrontare rigorosamente diverse ipotesi. Un credito del corso verrà dedicato all’utilizzo di un semplice software multifunzionale (Excel) per l’organizzazione e la rappresentazione grafica di semplici set di dati, e per svolgere alcune analisi di base.
Ogni argomento verrà insegnato facendo riferimento ad esempi concreti, di tipo biologico, naturalistico e medico. La biostatistica è infatti un mezzo per raggiungere un fine, che è quello di studiare e capire l’ambiente e gli organismi viventi, ed è solo attraverso una comprensione e una descrizione del contesto biologico che lo studente potrà apprendere le diverse tecniche statistiche.
Le principali conoscenze acquisite saranno:
- Elementi di base per la sintesi e la rappresentazione di un set di dati
- Concetti di errore di campionamento e distorsione
- La statistica inferenziale e la verifica delle ipotesi
- Elementi di base per l’analisi di variabili categoriche
- La distribuzione normale e i principali test parametrici per l'analisi di variabili numeriche
Le principali abilità (ossia la capacità di applicare le conoscenze acquisite) saranno:
-Sintetizzare con appropriati indici i dati raccolti in un esperimento o sul campo
-Rappresentare graficamente i dati
-Quantificare l’incertezza associata ai parametri stimati
-Svolgere test statistici di base, specifici per diversi tipi di variabili e di studi, al fine di confrontare rigorosamente ipotesi scientifiche
-Capire i limiti dell’analisi statistica e identificare quando le condizioni di applicabilità dei diversi test sono violate
-Progettare un esperimento o un campionamento in modo tale da evitare i principali errori che potrebbero in seguito inficiare l’analisi statistica. Prerequisiti
- Non sono previste propedeuticità. Sono richiesti gli strumenti di base logico-matematici acquisiti in qualsiasi scuola secondaria di secondo grado.
Contenuti del corso
- Il corso prevede 48 ore di didattica, ci cui 8 di esercitazioni mediante il foglio elettronico Excel. Il corso sarà accompagnato da molti esercizi durante i quali lo studente applicherà ad esempi di ambito biologico i metodi statistici imparati.
PARTE INTRODUTTIVA (circa 15 ore)
Statistica e campioni
Popolazioni e campioni. Il campionamento casuale. Correttezza e precisione. Tipi di variabili. Studi osservazionali e sperimentali, variabili di confondimento. Il contributo dei biologi allo sviluppo delle tecniche statistiche.
Basi di statistica descrittiva
Distribuzioni di frequenza. Istogrammi e diagrammi a barre. Visualizzare graficamente più variabili. Indici di posizione e indici di dispersione.
I concetti di base della statistica inferenziale
Distribuzione campionaria. Incertezza di una stima e il concetto di intervallo di confidenza. Basi di probabilità. Regole della somma e del prodotto di probabilità. Test di ipotesi. Il p-value. Distribuzione nulla. Errori di primo e di secondo tipo. Test bilaterali e unilaterali. Significatività statistica e biologica. Pseudoreplicazione.
TEST E ANALISI (circa 25 ore)
L’analisi dei dati di frequenza
Distribuzione binomiale e test binomiale. Errori nella stima delle proporzioni. La statistica test chi quadrato e la sua distribuzione. Il test del chi-quadrato e le sue assunzioni. Test sulla distribuzione di Poisson. Test sull’associazione tra variabili categoriche. Odds ratio.
Inferenze variabili con distribuzione normale
La distribuzione normale e normale standardizzata. Distribuzione della media campionaria e teorema del limite centrale. La statistica test t e la sua distribuzione. Il test t applicato ad un campione, a due campioni e a dati appaiati. L’ANOVA e il confronto tra medie di più di due gruppi. Accenni all'analisi della varianza a due criteri di classificazione Le assunzioni del test t e dell’ANOVA. Analisi della correlazione e della regressione.
Alternative ai test che assumo la distribuzione normale dei dati
Trasformazione dei dati. Test non parametrici. Test dei segni. Test di Mann-Whitney. Assunzioni dei test non parametrici.
Basi di disegno sperimentale e strategia del campionamento
Come ridurre la distorsione e l’errore di campionamento. La scelta della dimensione campionaria. Il problema dei test multipli. Errori durante gli esperimenti e durante l’analisi dei dati. Metodi didattici
- Il corso è organizzato in 40 ore di didattica frontale, durante le quali il docente impartirà le lezioni e svolgerà anche test statistici alla lavagna applicati a semplici data set di ambito biologico, e 8 ore dedicate all’utilizzo di Excel. Le ore di pratica con Excel verranno svolte in aula, e gli studenti potranno utilizzare i loro computer portatili o tablet. Il docente metterà a disposizione anche un certo numero di portatili per chi non dovesse averne uno proprio).
Modalità di verifica dell'apprendimento
- L’obiettivo della prova d’esame consiste nel verificare il livello di conoscenza ed approfondimento degli argomenti del programma del corso e la capacità di ragionamento sviluppata dallo studente. La valutazione è espressa in trentesimi (voto minimo 18). I due appelli di fine-corso sono scritti, e includono domande a scelta multipla o che richiedono brevi calcoli (circa 15), due o tre brevi casi studio dove è richiesta l’applicazione di un test statistico e due-tre domande inerenti all’uso di Excel. Gli altri 4 appelli durante l’anno (giugno, luglio e due in settembre) sono generalmente orali. Durante l’esame orale, come nel testo dell’esame scritto, il docente verificherà l’apprendimento sia dei concetti teorici che della loro applicazione a semplici analisi di dati.
Testi di riferimento
- Analisi Statistica dei Dati Biologici. Michael C. Whitlock & Dolph Schluter. Seconda edizione italiana condotta sulla terza edizione americana, Zanichelli. 2022.