Corso di Biostatistica

per le Scuole di Dottorato

Descrizione generale

Dove e Come

Il 22 luglio 2019 iniziano i corsi di Biostatistica per le/i studiose/i delle UMG PhD Schools. Il corso si svolge in uno dei laboratori informatici dell'Ateneo. Potrà però capitare di doverci trasferire per breve tempo in un'aula didattica. Vi consiglio perciò di:

Piccola sorpresa

Da quest'anno avremo un libro di testo con dei video tutorial e degli esercizi. Scegliete se leggerlo online oppure scaricarlo in formato pdf.

E-mail

Instagram

Gruppi WhatsApp

Non se ne parla nemmeno. Scordatevelo. ;-)

Corso base

Materiali base

Ecco la pagina di dataset che utilizzeremo durante il corso.

 

Seguiremo una versione ridotta del libro di testo.

Descrivere i dati

Misure di tendenza centrale, facciamo conoscenza con R, misure di dispersione, descrivere i dati nei design cross-section. Facciamo conoscenza con Orange, il boxplot. Descrivere i dati nei design a misure ripetute, l’equazione più pericolosa, sovrapporre due grafici con R, esercizi ed attività di approfondimento.

Prima verifica del corso.

A proposito: Licia ci segnala che ...

Le variabili aleatorie

Jacob Bernoulli e gli eventi dicotomici, Siméon Poisson e la conta degli eventi, Carl Gauss o della normalità. Esercizi ed attività di approfondimento

Alcuni comandi di R

Seconda verifica del corso.

C’era una volta il p-value

Il risultato è statisticamente significativo: dunque? Come nacque il t test, il test t di Student tra due campioni, ascesa e declino del p-value. La retta di regressione, covarianza e correlazione, l’idea di Francis Galton. Esercizi ed attività di approfondimento.

Alcuni comandi di R

Terza verifica del corso.

Che cos’è un modello lineare

I dettagli da conoscere (i residui, la devianza, la componente aleatoria). Il modello nullo è importante. Hirotugu Akaike: un nome da ricordare per sempre. La diagnostica del modello lineare. Lineare non è sinonimo di 'rettilineo', anche il t test è un modello lineare. Ancova: unire i predittori numerici ai fattori. Anova: la generalizzazione del t test. La meta finale: condurre un’analisi multivariabile. Interpretare il modello minimale adeguato. Tecniche di linearizzazione: il modello logistico. Esercizi ed attività di approfondimento.

Alcuni comandi di R

Quarta verifica del corso.

Corso avanzato

Materiali base

Ecco la pagina di dataset che utilizzeremo durante il corso.

 

Seguiremo una versione ridotta del libro di testo.

C'è una crisi in atto?

Il risultato è statisticamente significativo: dunque? Ascesa e declino del p-value. Hirotugu Akaike: un nome da ricordare per sempre. Richiami di R: Ancova ed Anova nei design cross-section. Differenze tra R e GraphPad Prism.

Guardiamo questa immagine generata con questi comandi.

Costruire biomarcatori clinici

La variabile aleatoria binomiale. I modelli lineari generalizzati: i dettagli da conoscere (la funzione di collegamento, interpretare una regressione logistica, problemi con lo standard error, la sovradispersione, la meta finale: valutare l’accuratezza del modello logistico; la curva ROC. Esercizi ed attività di approfondimento.

Alcuni comandi di R

Prima verifica del corso.

Misure ripetute

Design Longitudinali e design in replicato, evitando la 'anova repeated measure'.

Alcuni comandi di R

Seconda verifica del corso.

Terza verifica del corso.

Analisi di sopravvivenza

Alcuni comandi di R

Potenza e sample size

Quarta verifica del corso.