% Utilizzando i dati della zona A1:D100 % 1) Calcolare la matrice di correlazione, la matrice di cograduazione ed i % relativi p-values. Commentare la significatività della relazione lineare % tra spesa e visite e la significatività della cograduzione tra spesa e % visite. % 2) Costruire la matrice dei diagrammi di dispersione delle variabili età % visite e spesa. Commentare il diagramma tra visite e spesa % 3) Costruire la matrice dei diagrammi di dispersioni delle variabili età, % visite e spesa utilizzando un diverso simbolo in base al numero di % componenti % 4) Utilizzando tutte le variabili applicare la tecnica delle componenti % principali. Interpretare le prime due componenti latenti. % 5) Costruire il biplot ed interpretare l'angolo nel biplot tra i vettori % associati alle variabili visite e spesa % 6) Dopo aver standardizzato le variabili costruire la matrice delle % distanze della città a blocchi tra le prime 6 unità. % 7) Costruire un diagramma di dispersione con 6 punti che presentano una % perfetta cograduazione ma una correlazione lineare non esattamente pari a % 1 % 8) Costuire il boxplot della variabile spesa per ogni modalità della % variabile componenti %% Caricamento dati X=readtable('ADMfeb2021.xlsx','Range','A1:D100','ReadRowNames',false); X.Properties.VariableNames(1)="eta"; %% Xdouble Dataset in formato array (solo numeri senza intestazioni) Xdouble=X{:,:}; %% Matrice di correlazione e matrice di cograduazione % 1) Calcolare la matrice di correlazione, la matrice di cograduazione ed i % relativi p-values. Commentare la significatività della relazione lineare % tra spesa e visite e la significatività della cograduzione tra spesa e % visite. %% Matrice di correlazione [R,Pval]=corr(Xdouble); % nomiq = vettore che contiene i nomi delle variabili nomiq=X.Properties.VariableNames; disp('Matrice di correlazione e p-values del test di assenza di correlazione') Rtable=array2table(R,'VariableNames',nomiq,'RowNames',nomiq); disp(Rtable) Pvaltable=array2table(Pval,'VariableNames',nomiq,'RowNames',nomiq); disp(Pvaltable) % Relazione lineare altamente significativa tra visite e spesa %% Matrice di cograduazione [R,Pval]=corr(Xdouble,'Type','Spearman'); % nomiq = vettore che contiene i nomi delle variabili nomiq=X.Properties.VariableNames; disp('Matrice di cograduazione e p-values del test di assenza di cograduazione') Rtable=array2table(R,'VariableNames',nomiq,'RowNames',nomiq); disp(Rtable) Pvaltable=array2table(Pval,'VariableNames',nomiq,'RowNames',nomiq); disp(Pvaltable) %% spmplot % 2) Costruire la matrice dei diagrammi di dispersione delle variabili età % visite e spesa. Commentare il diagramma tra visite e spesa spmplot(X(:,[1 2 4])) %% Scatterplot matrix con variabile di raggruppamento % 3) Costruire la matrice dei diagrammi di dispersioni delle variabili età, % visite e spesa utilizzando un diverso simbolo in base al numero di % componenti spmplot(X(:,[1 2 4]),X{:,3}) %% Analisi in componenti principali outPCA=pcaFS(X); % Utilizzando il criterio di spiegare almeno 0.95^4 dovrei spiegare almeno % l'81 per cento circa. Con le prime due PC spiego solo il 81.92 per cento % Prima CP (correlata positivamente con spesa e visite) % Seconda CP (correlata positivamente con età e componenti) % Valori elevati della prima PC = consumatori con elevate visite e elevata spesa %% Biplot % 5) Costruire il biplot ed interpretare l'angolo nel biplot tra i vettori % associati alle variabili visite e spesa % Angolo tra le variabili spesa e visite molto piccolo. % Variabili correlate in maniera forte e diretta %% Matrice distanze città a blocchi % 6) Dopo aver standardizzato le variabili costruire la matrice delle % distanze della città a blocchi tra le prime 6 unità. StCityBlock=squareform(pdist(zscore(Xdouble),'cityblock')); StCityBlock=StCityBlock(1:6,1:6); %% rhoxy=1 ma rxy non esattamente uguale a 1 % 7) Costruire un diagramma di dispersione con 6 punti che presentano una % perfetta cograduazione ma una correlazione lineare non esattamente pari a % 1 figure x=(1:6)'; y=2+3*x; y(1)=1; plot(x,y,'o') xlabel('asse x') ylabel('asse y') % Coefficiente di cograduazione disp('Coefficiente di cograduazione') disp(corr(x,y,'Type','Spearman')) % Coefficiente di correlazione disp('Coefficiente di correlazione') disp(corr(x,y)) % I punti presentano perfetta cograduazione ma relazione lineare non % esattamente pari a 1 (non sono tutti lungo la retta) %% Boxplot % 8) Costuire il boxplot della variabile spesa per ogni modalità della % variabile componenti boxplot(X.spesa,X.componenti);