Lucidi delle lezioni (a.a. 2023/2024)
Settimana I: introduzione al corso, introduzione a MATLAB. Tipologia di variabili: array numerici, characters, string, table, struct. Importazione di file tramite tasks. Creazione di plot tramite tasks.
Settimana II
LIBRI DI TESTO
Riani M., Corbellini A. Laurini F., Morelli G., Proietti T., Perrotta D. Torti F. (2023). Data Science con MATLAB, (seconda edizione), Giappichelli editore, Torino.
Disponibile presso la libreria MEDICO SCIENTIFICA dal 18/09/2023 oppure tramite AMAZON
Comando da eseguire dentro MATLAB per scaricare il materiale
aggiuntivo di corredo al libro !git
clone https://github.com/UniprJRC/DSconMATLAB
File youtube con le modalità di esame
Le lezioni della prima settimana e della prima lezione della seconda
settimana sono state inserite nel canale youtube
https://www.youtube.com/channel/UCvrSSDHucSqwnjuEFmOAe2w
SOFTWARE utilizzato durante il corso Excel e MATLAB 2023a e MATLAB 2023b. Per gli studenti che seguono i corsi di MATLAB Academy è stata resa disponibile da qualche giorno la possibilità di generare in modo automatico dal sistema una certificazione
che può essere condivisa con Facebook o Linkedin:
Per utilizzare MATLAB on line per potersi esercitare utilizzando
direttamente il browser è possibile fare click su
questo link
COMPONENTI AGGIUNTIVI DI MATLAB DA SCARICARE
Link per scaricare il MATLAB toolbox FSDA (Flexible Statistics Data
Analysis) dal sito web Mathworks, sviluppato congiuntamente
dall'Università di Parma e dal Joint Research Centre della Commissione
Europea
Lucidi delle lezioni (a.a. 2022/2023) Introduzione alla programmazione:
istruzioni if, cicli for e while. Istruzione assert.
Importazione di file esterni dentro MATLAB. Standardizzazione
dei dati. Cicli for e while, assert. Distribuzioni di frequenze.
Analisi univariate di variabili categoriche e
quantitative. Analisi riferite a sottogruppi di unità Terza settimana: Intervalli di confidenza con
o senza variabile di raggruppamento. Tabelle di contingenza e tabelle
pivot. Analisi delle distribuzioni: funzione densità, funzione di
ripartizione, quantili e generazioni di numeri casuali, da diverse
distribuzioni univariate (normale, uniforme, chi quadrato, T di
Student). Distribuzione normale bivariata. Analisi preliminari dei dati:
gestione dei dati mancanti e dei valori anomali. FIno al capitolo 5 Quarta settimana:
Introduzione alla relazione tra due variabili: covarianza e
coefficiente di correlazione lineare.
Matrice di covarianze e matrice
di correlazione. Test sulla significatività del coefficiente di
correlazione. Verifica empirica della distribuzione del test di assenza
di correlazione. Correlazione tra i ranghi. Relazione tra correlazione e
cograduazione. Correlazione e cograduazione in presenza di missing
values. 165-183 del testo.
Le rappresentazioni grafiche per serie storiche univariate
(grafici a barre orizzontali, verticali, a linee ed area). Grafici a
cascata. Rappresentazioni grafiche per serie storiche bivariate. Grafici
ad imbuto. Grafici per la stima della densità (approccio parametrico e
non parametrico). Grafici a dispersione personalizzati. Grafici a
dispersione con istogrammi o boxplot ai margini con o senza variabile di
raggruppamento. Grafici con istogrammi bivariati. Grafici per l'analisi
di regressione. Il balloonplot. Matrice dei diagrammi di dispersione
(con o senza variabile di raggruppamento). Heatmap, coordinate parallele
e rappresentazione iconica. Capitolo 8 del testo
Indici di associazione. Tabelle 2x2, Tabelle IxJ. Misure
basate sulla statistica di Pearson. Misure basate sul rapporto
dei prodotti incrociati. Indici di associazione basati sulla
riduzione dell'errore. Indici di associazione basati sulla
riduzione dell'eterogeneità. Indici di associazione per
variabili ordinali. Settimana VI
(parte I) Algebra lineare avanzata (norme prodotto scalare, forme
quadratiche, spazio vettoriale, rango, autovalori e autovettori,
proiezioni ortogonali, Settimana VI (parte II) introduzione ai poligoni, distanze e indici di similarità.
Componenti principali. Approccio basato sulla combinazione
lineare delle variabili originarie (lezione del mattino).
Approccio basato sulla proiezione dei punti in un sottospazio
oppure sulla rappresentazione della matrice originaria con una
matrice di rango ridotto. Esempi pratici di applicazione della
tecnica delle componenti principali 10/11/2021
Introduzione ai profili riga e colonna.
Analisi delle corrispondenze, proiezione
in un sottospazio di punti che presentano diverso peso nella
metrica ponderata. Esempi di utilizzo dell'analisi delle
corrispondenze.
Introduzione alla classificazione (supervisionata e non
supervisionata). Clustering gerarchico e taglio del
dendrogramma. Clustering non generarchico. Scelta del numero
ottimo di gruppi. Introduzione al clustering robusto.
Cenni sull'analisi testuale.
MATLAB ACADEMY
Gli studenti dell'Università di Parma possono seguire un corso
approfondito di MATLAB
dall'indirizzo web
https://matlabacademy.mathworks oppure facendo click sul pulsante "Learn MATLAB" una volta lanciato il programma
Si noti che per gli utenti non UNIPR questi corsi sono a
pagamento e sono davvero molto costosi.
Link alla pagina github di
FSDA
Link alla documentazione di FSDA