Marco Riani, Professor of Statistics

      Univ. of Parma (ITALY)

STATISTICA PER LA DIGITAL ECONOMY

Esame 26 gennaio 2023


Testo

Soluzione


 

 

Esame 12 gennaio 2023

Testo

Soluzione

 


 

Soluzione prova esame SDE dicembre

I risultati apparsi sono comprensivi del punto aggiuntivo per il seminario

Vincitori dei 3 premi Mathworks

Prima classificata: Irene Falco

Secondi a pari merito: Alecci Lorenzo e Nicola Caleffi

Questi studenti possono passare a ritirare il premio mercoledì 21 dicembre (mattina o preferibilmente nel pomeriggio)



Lucidi delle lezioni

Lucidi prima settimana    22/09/2022

Lucidi seconda-inizio quinta settimana 17/10/2022 (fino alle rappresentazione grafiche)

Lucidi quinta settimana - inizio sesta settimana  25/10/2022 (tabelle di contingenza)

Lucidi sesta settimana   27/10/2022  (algebra lineare avanzata)

Lucidi settimana settimana 03/11/2022 (introduzione ai poligoni e distanze)

Lucidi ottava e nona settimana 10/11/2022 e 17/11/2022 (riduzione delle dimensioni, componenti principali)

Lucidi decima settimana 24/11/2022 (analisi delle corrispondenze)

Lucidi undicesima settimana 29/11/2022 (cluster analysis)

 

LIBRI DI TESTO

Riani M., Corbellini A. Laurini F., Morelli G. Perrotta D. Torti F. (2022). Data Science con MATLAB, Giappichelli editore, Torino.

 

Disponibile presso la libreria MEDICO SCIENTIFICA oppure tramite AMAZON


ORARI DELLE LEZIONI

MAR 8.30-10-30 (frontale)
GIO 8.30-10.30 (frontale)
VEN 10.30-12..30 (esercitazione in laboratorio)




Link al canale youtube dove visualizzare le lezioni

https://www.youtube.com/channel/UC39WAVKLsGm1YJKWBsSlHkw

 


 

SYLLABUS


 


Software utilizzato durante il corso

Excel  e MATLAB 2022B

Gli studenti dell'Università di Parma possono scaricare MATLAB in maniera completamente gratuita




Una volta creato l'account potete scaricare il software sulle postazioni che desiderate.

Istruzione per l'esame

Tutte le prove saranno a computer (consegna di file  .m oppure .mlx).

Formato del file di consegna
cognome_nome_matricola.m (file in formato MATLAB)
oppure
cognome_nome_matricola.mlx (file in formato MATLAB live script)



Link per scaricare il MATLAB toolbox FSDA (Flexible Statistics Data Analysis) dal sito web Mathworks, sviluppato congiuntamente dall'Università di Parma e dal Joint Research Centre della Commissione Europea

Link alla pagina github di FSDA

Link alla documentazione di FSDA


Avviso

Per utilizzare MATLAB on line per potersi esercitare utilizzando direttamente il browser è possibile fare click su questo link



MATLAB ACADEMY

Gli studenti dell'Università di Parma possono seguire un corso approfondito di MATLAB dall'indirizzo web 
https://matlabacademy.mathworks oppure facendo click sul pulsante "Learn MATLAB" una volta lanciato il programma


Si noti che per gli utenti non UNIPR questi corsi sono a pagamento e sono davvero molto costosi.

Per gli studenti che seguono i corsi di MATLAB Academy è stata resa disponibile da qualche giorno la possibilità di generare in modo automatico dal sistema una certificazione che può essere condivisa con Facebook o Linkedin:


Link alla pagina web di Mathworks dove svolgere esercizi aggiuntivi. Potete iniziare da questo link

MATLAB Cody - MATLAB Central (mathworks.com)


 

 

 



 

FILE DI CORREDO AL CORSO


File di integrazione.

Prima settimana


Argomento Obiettivo File di input File di output Data ultima modifica
Importazione dati da file esterni Importazione di file excel dentro una MATLAB table. Estrazione di dati
firm.m
Firm.xlsx

firm_out.m
11/09/2021
Statistiche descrittive Importare i dati dentro MATLAB da file Excel. Standardizzare i dati. Introduzione alle operazioni matriciali.  Confrontare la standardizzazione robusta con quella tradizionale. Indici di asimmetria e curtosi. stand.xlsx
stand.m
stand_out.m (file con solo codice)
stand_outMLX.mlx (file con codice e output del codice)

15/09/2021
Richiami di statistica  descrittiva Inserire i dati dentro MATLAB. Quantili. Creare e interpretare i boxplots. Esplorare le opzioni di una determinata funzione, inserire controlli avanzati nei file .mlx boxp.mlx boxp_outMLX.mlx 18/09/2020
Richiami di statistica  descrittiva Boxplot per sottogruppi di unità Firm.xlsx
boxp2.m
boxp2_out.m 16/09/2020
Richiami di statistica  descrittiva Calcolare statistiche ponderate.
Cicli for.
indicatori_economici.xlsx
stat_ponderate.mlx
stat_ponderate_ outMLX.mlx 16/09/2020


Seconda settimana


Richiami di statistica  descrittiva Distribuzioni di frequenze.
Cicli for annidati.
distr_freq.m
oppure
distr_freq.mlx
distr_freq_out.m
oppure
distr_freq_outMLX.mlx
16/09/2020
Richiami di statistica  descrittiva (analisi univariate) Esercizio di riepilogo.
 Creare uno script che effettui in automatico una serie di operazioni. Introduzione alle rappresentazioni grafiche.
Firm.xlsx

analisi_prel.m
analisi_prel_out.m
analisi_prel_outMLX.mlx
15/09/2020
Richiami di statistica  descrittiva (analisi bivariate) Richiami sul coefficiente di correlazione
corr.xlsx
correlazione_intro.m
oppure

correlazione_intro.mlx
correlazione_intro_out.m
oppure
correlazione_intro_outMLX.mlx
26/09/2021
Funzioni di densità e di ripartizione e quantili Richiami distribuzione normale univariata e distributione T di Student normale.mlx normale_out.mlx 02/10/2019
Funzioni di densità della normale bivariata Distribuzione normale bivariata e grafici 3D bivarnorm.mlx bivarnorm_out.mlx 22/09/2020



Terza settimana
 
Relazioni lineari 2 o più fenomeni Test sulla  significatività delle relazione lineari tra coppie di variabili conanR.xlsx

testrho.m
testrho_out.m 27/09/2021
Relazioni tra i gradi o posti d'ordine Indice di cograduazione di Spearman cograduazione.m cograduazione_out.m
cograduazione_outMLX.mlx
11/10/2021
Relazioni lineari e non lineari tra due o più fenomeni in presenza di valori mancanti Matrici di correlazione e di cograduazione in presenza di dati completi e di valori mancanti.  
tagliatelle.xlsx
correlazioneMIS.m
correlazioneMIS_out.m 27/09/2021
Ripasso sul modello di regressione Simulare i dati necesseri per creare un modello di regressione. Stimare i parametri con diverse ormule di calcolo. Comprendere la differenza tra parametri veri e stimati. Verificare empiricamente il teorema di Sastry e Nag. regr.mlx 
regr_outMLX.mlx
27/09/2021
Miscellanea Esercizi basati sui cicli for cicli cicli_out.m 21/09/2018



Quarta settimana
v.c. Chi quadrato Densità, ripartizione e quantili in una v.c. Chi quadrato chi2.m
chi2.mlx
chi2_out.m
chi2_outMLX.mlx
24/10/2018



Tabelle di contingenza Test di associazione in tabelle di contingenza 2x2 tabelle2x2.mlx tabelle2x2_out.m
06/10/2021
 
Tabelle di contingenza Test di associazione in tabelle di contingenza rxc tabellerxc.m
tabellerxc.mlx
sondUSA.xlsx
tabellerxc_out.m
07/10/2021


Tabelle di contingenza Indici di eterogeneità entropia.m entropia_out.m 07/10/2020
Tabelle di contingenza Indici di associazione e riduzione dell'eterogeneità per variabili qualitative nominali (partendo dalla tabella di contingenza) AssNom.mlx AssNom_out.mlx 07/10/2020

Tabelle di contingenza Indici di associazione e riduzione dell'eterogeneità per variabili qualitative nominali (partendo da una matrice di dati) spumanti.xlsx
AssNom1.mlx
AssNom1_out.mlx 07/10/2020

 Quinta settimana


Tabelle di contingenza Indici di associazione per variabili qualitative ordinali. Creazione di una funzione MATLAB per il calcolo degli indici di contingenza in presenza di fenomeni qualitativi ordinali AssOrd.mlx miaOrdinal.m
AssOrd_out.mlx
07/10/2020


Test ANOVA Test sull'uguaglianza delle medie. Scomposizione della varianza tra i gruppi e nei gruppi. Creazione di una nuova funzione MATLAB per il calcolo degli intervalli di confidenza anova.mlx
univUSAanova.xlsx
anova_out.mlx
Confint.m
14/10/2020

 

Grafici bivariati Diagrammi di dispersione bivariati personalizzati e boxplot bivariati scatter2D.m scatter2D_out.m
15/10/2021
Grafici trivariati Diagrammi di dispersione trivariati personalizzati scatter3D.m
conadr.xlsx
scatter3D_out.m
15/10/2021
Grafici multivariati Scatter plot matrix, rappresentazione iconica, coordinate parallele. spm.m
Indicatori_economici.xlsx
spm_out.m
22/11/2021



Sesta settimana


Operazioni matriciali Statistiche descrittive tramite operazioni matriciali
ope_matr.m ope_matr_out.m 19/10/2021
Autovalori e autovettori Calcolo degli autovalori e degli autovettori autov.m autov_out.m 12/11/2022
Scomposizioni matriciali Scomposizione spettrale e scomposizione in valori singolari scomp.m scomp_out.m 12/11/2022
Riduzione delle dimensioni Componenti principali compprin.m
benessere.xlsx
compprin_out.m
20/10/2021

Settima settimana

Ridouzione delle dimensioni Rappresentazione simultanea delle unità e delle variabili in uno spazio a dimensione ridotta. BIPLOT.
biplotdin.m biplotdin_out.m

Il file di output in formato .mlx contiene i parametri alpha e omega visualizzati tramite slider
biplotdin_out.mlx
07/11/2019
Componenti principali Esempi pratici di applicazione della tecnica delle componenti principali

wafer.txt

 

lavatrici.xlsx

 

scrittori.xlsx

scrittori.m

 

Risoluzione tramite funzione pcaFS


PCexamples.m

Risoluzione senza utilizzare pcaFS.m

scrittori_out.m

 





03/11/2020

Distanze e similarità Tipologie di distanza distanze.m
distanze_out.m
06/11/2020
Distanze e similarità Esplorare le differenze tra le distanze Euclidee e le distanze di Mahalanobis EuclidMala.m
EuclidMala_out.m
06/11/2020
Indice di Gower Calcolare la matrice degli indici di similarità di Gower

Gower.m

Gower_out.m

11/11/2020


Ottava settimana


Riduzione delle dimensioni per variabili categoriche Analisi delle corrispondenze corrisp.m
corrisp.xlsx
corrisp_out.m 03/11/2020
Analisi delle corrispondenze Utilizzo della funzione corAna di FSDA toolbox.Spiegazione output di corAna
corrisp.xlsx CAexamples.m

04/11/2020
Analisi delle corrispondenze Analisi delle corrispondenze per spiegare la relazione tra partito e posizione sulla pena capitale in USA Esame dicembre 2019 input Soluzione
03/11/2020


Nona settimana

Clustering gerarchico Programma di agglomerazione gerarchico. Costruzione del dendrogramma partendo dalla matrice delle distanze clustGER.mlx clustGER_out.mlx 19/11/2021
Classificazione Metodi gerarchici e non gerarchici di cluster analysis gruppi.m
gruppi_out.m 19/11/2021


Analisi testuale Rappresentare graficamente le distribuzione di frequenze delle parole presenti in un testo (cloudplot, nuvola di etichette). Effettuare la "tokenizzazione" (analisi lessicale) del documento, eliminare le "stop words" e creare la distribuzione di frequenze delle parole maggiormente presenti parole.m
parole.pdf
parole_out.m 11/11/2020





Esercitazione 2020
Soluzione (formato .m)


File con prove di esame passate

 

Test2

Soluzione

 

Test3 File di input

Soluzione

 

Esame del 18/12/2018

Testo

File di input

Soluzione

 

TEST 2019

File di input

Testo

Soluzione

 

Esame 08/09/2021
Testo e file di di input
Soluzione


Esame 23/06/2021
Testo
Soluzione
 


Esame 09/06/2021
Testo
Soluzione


Esame 26/05/2021
Testo e soluzione


Esame 29 gennaio 2021
File di input
Soluzione




Esame 15 gennaio 2021
File di input
Soluzione




Esame dicembre 2020
Testo
Soluzione

Prova di esame del 14/12/2021

Testo

Soluzione






Esercitazione finale del 7 dicembre 2021


Testo

http://www.riani.it/SDE/InputFiles/test2021SDE.m

Soluzione

Osservazione: si assume che sia stato scaricato FSDA toolbox ultima versione.


Esame del 12/01/2022
Testo
File di input
Soluzione


Esame 6 settembre 2022. Soluzione  



Esame del 24/05/2022
Testo
Soluzione


Esame del 26/01/2022
Testo
Soluzione