Marco Riani, Professor of Statistics

      Univ. of Parma (ITALY)

STATISTICA PER LA DIGITAL ECONOMY

Esame 09/06/2021
Testo
Soluzione


Esame 26/05/2021
Testo e soluzione


Esame 29 gennaio 2021
File di input
Soluzione




Esame 15 gennaio 2021
File di input
Soluzione




Esame dicembre 2020
Testo
Soluzione




Link alla pagina web di Mathworks dove svolgere esercizi aggiuntivi. Potete iniziare da questo link

MATLAB Cody - MATLAB Central (mathworks.com)

Istruzione per l'esame

Tutte le prove saranno a computer (consegna di file  .m oppure .mlx).

Formato del file di consegna
cognome_nome_matricola.m (file in formato MATLAB)
oppure
cognome_nome_matricola.mlx (file in formato MATLAB live script)

•     16 dicembre 2020 ore 15.30 (prova al computer)
      Link per il deposito documento di riconoscimento
      Link per consegnare la prova di esame

•    15 gennaio 2021 ore 9.00 (prova al computer)
    
  Link per il deposito documento di riconoscimento
       Link per consegnare la prova di esame

•    29 gennaio 2021 ore 9.00 (prova al computer)
       Link per il deposito documento di riconoscimento
       Link per consegnare la prova di esame

•    26 maggio 2021 ore 9.00 (prova al computer)
  
     Link per il deposito documento di riconoscimento
       Link per consegnare la prova di esame

•    9 giugno 2021 ore 9.00 (prova al computer)
    
 Link per il deposito documento di riconoscimento
       Link per consegnare la prova di esame

•    23 giugno 2021 ore 9.00 (prova al computer)
   
   Link per il deposito documento di riconoscimento
       Link per consegnare la prova di esame

•    8 settembre 2021 ore 9.00 (prova al computer)
      Link per il deposito documento di riconoscimento
       Link per consegnare la prova di esame




SEMINARIO 11 NOVEMBRE 2020 Ore 10.00

Programmazione in MATLAB e applicazioni pratiche sui dati gestiti dal Centro Comune di Ricerca della Commissione Europea


SLIDES seminario




Link diretto alle lezioni in streaming e/o per partecipare agli esami


https://teams.microsoft.com/l/team/19%3aaea8641ef4c749d08c65b5bb52edfa5a%40thread.tacv2/conversations?groupId=3229a654-95ec-4290-8ac6-affa649e2bd6&tenantId=bb064bc5-b7a8-41ec-babe-d7beb3faeb1c


Link al canale youtube dove visualizzare le lezioni passate

https://www.youtube.com/channel/UC39WAVKLsGm1YJKWBsSlHkw

 

ORARI DELLE LEZIONI

MER 11.00-13.00 (diretta streaming)
GIO 9.00-11.00 (diretta streaming)
VEN 11.00-13.00 (esercitazione in diretta streaming)


 

SYLLABUS


 


Software utilizzato durante il corso

Excel 2016 e MATLAB 2020B

Gli studenti dell'Università di Parma possono scaricare MATLAB in maniera completamente gratuita




Una volta creato l'account potete scaricare il software sulle postazioni che desiderate.

Link per scaricare il MATLAB toolbox FSDA (Flexible Statistics Data Analysis) dal sito web Mathworks, sviluppato congiuntamente dall'Università di Parma e dal Joint Research Centre della Commissione Europea

Link alla pagina github di FSDA

Link alla documentazione di FSDA


Avviso

Per utilizzare MATLAB on line per potersi esercitare utilizzando direttamente il browser è possibile fare click su questo link



MATLAB ACADEMY

Gli studenti dell'Università di Parma possono seguire un corso approfondito di MATLAB dall'indirizzo web  https://trainingenrollment.mathworks.com/selfEnrollment?code=TA6EEH5EYZTZ

Per gli studenti che seguono i corsi di MATLAB Academy è stata resa disponibile da qualche giorno la possibilità di generare in modo automatico dal sistema una certificazione che può essere condivisa con Facebook o Linkedin:



 

Lucidi delle lezioni

Lucidi prima e seconda settimana    15/09/2020

Lucidi terza settimana 02/12/2020

Lucidi quarta settimana   11/10/2019

Lucidi quinta settimana   18/10/2019

Lucidi sesta e settima settimana  07/11/2019

Lucidi ottava settimana 15/11/2019

Lucidi nona settimana (distanze)  20/11/2019

Lucidi nona settimana  21/11/2019


 

FILE DI CORREDO AL CORSO


File di integrazione.

Prima settimana


Argomento Obiettivo File di input File di output Data ultima modifica
Statistiche descrittive Importare i dati dentro MATLAB da file Excel. Standardizzare i dati. Introduzione alle operazioni matriciali.  Confrontare la standardizzazione robusta con quella tradizionale. Indici di asimmetria e curtosi. stand.xlsx
stand.m
standout.m (file con solo codice)
standoutMLX.mlx (file con codice e output del codice)

18/09/2020
Richiami di statistica  descrittiva Inserire i dati dentro MATLAB. Quantili. Creare e interpretare i boxplots. Esplorare le opzioni di una determinata funzione, inserire controlli avanzati nei file .mlx boxp.mlx boxpoutMLX.mlx 18/09/2020
Richiami di statistica  descrittiva Boxplot per sottogruppi di unità Firm.xlsx
boxp2.m
boxp2out.m 16/09/2020
Richiami di statistica  descrittiva Calcolare statistiche ponderate.
Cicli for.
indicatori_economici.xlsx
stat_ponderate.mlx
stat_ponderate outMLX.mlx 16/09/2020


Seconda settimana


Richiami di statistica  descrittiva Distribuzioni di frequenze.
Cicli for annidati.
distr_freq.m
oppure
distr_freq.mlx
distr_freqout.m
oppure
distr_freqoutMLX.mlx
16/09/2020
Richiami di statistica  descrittiva (analisi univariate) Esercizio di riepilogo.
 Creare uno script che effettui in automatico una serie di operazioni. Introduzione alle rappresentazioni grafiche.
Firm.xlsx

analisi_prel.m
analisi_prel_out.m
analisi_prel_outMLX.mlx
15/09/2020
Richiami di statistica  descrittiva (analisi bivariate) Richiami sul coefficiente di correlazione
corr.xlsx
correlazione_intro.m
oppure

correlazione_intro.mlx
correlazione_intro_out.m
oppure
corelazione_intro_out.mlx
04/10/2019
Funzioni di densità e di ripartizione e quantili Richiami distribuzione normale univariata e distributione T di Student normale.mlx normale_out.mlx 02/10/2019
Funzioni di densità della normale bivariata Distribuzione normale bivariata e grafici 3D bivarnorm.mlx bivarnorm_out.mlx 22/09/2020
Relazioni lineari o più fenomeni Test sulla  significatività delle relazione lineari tra coppie di variabili conanR.xlsx

testrho.m
testrho_out.m 24/09/2020
Relazioni tra i gradi o posti d'ordine Indice di cograduazione di Spearman cograduazione.m cograduazione_out.m
cograduazione_out.mlx
24/09/2020



Terza settimana
 
Relazioni lineari e non lineari tra due o più fenomeni in presenza di valori mancanti Matrici di correlazione e di cograduazione in presenza di dati completi e di valori mancanti.  
tagliatelle.xlsx
correlazioneMIS.m
correlazioneMIS_out.m 30/09/2020
Miscellanea Esercizi basati sui cicli for cicli cicli_out.m 21/09/2018



Quarta settimana
v.c. Chi quadrato Densità, ripartizione e quantili in una v.c. Chi quadrato chi2.m
chi2.mlx
chi2_out.m
chi2_outMLX.mlx
24/10/2018



Tabelle di contingenza Test di associazione in tabelle di contingenza 2x2 tabelle2x2.mlx tabelle2x2_out.m
06/10/2020
 
Tabelle di contingenza Test di associazione in tabelle di contingenza rxc tabellerxc.m
tabellerxc.mlx
sondUSA.xlsx
tabellerxc_out.m
06/10/2020

 Quinta settimana


Tabelle di contingenza Indici di eterogeneità entropia.m entropiaout.m 07/10/2020
Tabelle di contingenza Indici di associazione e riduzione dell'eterogeneità per variabili qualitative nominali (partendo dalla tabella di contingenza) AssNom.mlx AssNom_out.mlx 07/10/2020

Tabelle di contingenza Indici di associazione e riduzione dell'eterogeneità per variabili qualitative nominali (partendo da una matrice di dati) spumanti.xlsx
AssNom1.mlx
AssNom1_out.mlx 07/10/2020


Tabelle di contingenza Indici di associazione per variabili qualitative ordinali. Creazione di una funzione MATLAB per il calcolo degli indici di contingenza in presenza di fenomeni qualitativi ordinali AssOrd.mlx miaOrdinal.m
AssOrd_out.mlx
07/10/2020


Test ANOVA Test sull'uguaglianza delle medie. Scomposizione della varianza tra i gruppi e nei gruppi. Creazione di una nuova funzione MATLAB per il calcolo degli intervalli di confidenza anova.mlx
univUSAanova.xlsx
anova_out.mlx
Confint.m
14/10/2020

 

Grafici bivariati Diagrammi di dispersione bivariati personalizzati e boxplot bivariati scatter2D.m scatter2D_out.m
15/10/2020
Grafici trivariati Diagrammi di dispersione trivariati personalizzati scatter3D.m
conadr.xlsx
scatter3D_out.m
15/10/2020

Sesta settimana

Grafici multivariati Scatter plot matrix, rappresentazione iconica, coordinate parallele. spm.m
Indicatori_economici.xlsx
spm_out.m
22/11/2019


Per comprendere meglio i file che seguono è necessario scaricare il file notazioneSDE.pdf (versione 23/10/2020)

Operazioni matriciali Statistiche descrittive tramite operazioni matriciali
ope_matr.m ope_matr_out.m 22/10/2020
Autovalori e autovettori Calcolo degli autovalori e degli autovettori autov.m autov_out.m 22/10/2020
Scomposizioni matriciali Scomposizione spettrale e scomposizione in valori singolari scomp.m scomp_out.m 23/10/2020
Riduzione delle dimensioni Componenti principali compprin.m
benessere.xlsx
compprin_out.m
23/10/2020

Settima settimana

Ridouzione delle dimensioni Rappresentazione simultanea delle unità e delle variabili in uno spazio a dimensione ridotta. BIPLOT.
File di supporto
biplotdin.m biplotdin_out.m

Il file di output in formato .mlx contiene i parametri alpha e omega visualizzati tramite slider
biplotdin_out.mlx
07/11/2019
Componenti principali Esempi pratici di applicazione della tecnica delle componenti principali

wafer.txt

 

lavatrici.xlsx

 

scrittori.xlsx

scrittori.m

 

Risoluzione tramite funzione pcaFS


PCexamples.m

Risoluzione senza utilizzare pcaFS.m

scrittoriout.m

 





03/11/2020



Ottava settimana


Riduzione delle dimensioni per variabili categoriche Analisi delle corrispondenze corrisp.m
corrisp.xlsx
corrisp_out.m 03/11/2020
Analisi delle corrispondenze Utilizzo della funzione corAna di FSDA toolbox.Spiegazione output di corAna
corrisp.xlsx CAexamples.m

04/11/2020
Analisi delle corrispondenze Analisi delle corrispondenze per spiegare la relazione tra partito e posizione sulla pena capitale in USA Esame dicembre 2019 input Soluzione
03/11/2020


Nona settimana

Distanze e similarità Tipologie di distanza distanze.m
distanze_out.m
06/11/2020
Distanze e similarità Esplorare le differenze tra le distanze Euclidee e le distanze di Mahalanobis EuclidMala.m
EuclidMalaout.m
06/11/2020
Indice di Gower Calcolare la matrice degli indici di similarità di Gower

Gower.m

Gowerout.m

11/11/2020

Clustering gerarchico Programma di agglomerazione gerarchico. Costruzione del dendrogramma partendo dalla matrice delle distanze clustGER.mlx clustGER_out.mlx 22/11/2019
Classificazione Metodi gerarchici e non gerarchici di cluster analysis gruppi.m
gruppi_out.m 30/11/2018


Analisi testuale Rappresentare graficamente le distribuzione di frequenze delle parole presenti in un testo (cloudplot, nuvola di etichette). Effettuare la "tokenizzazione" (analisi lessicale) del documento, eliminare le "stop words" e creare la distribuzione di frequenze delle parole maggiormente presenti parole.m
parole.pdf
paroleout.m 11/11/2020





Esercitazione 2020
Soluzione (formato .m)


File con prove di esame passate

 

Test2

Soluzione

 

Test3 File di input

Soluzione

 

Esame del 18/12/2018

Testo

File di input

Soluzione

 

TEST 2019

File di input

Testo

Soluzione