%% PARTE I % Il foglio "dati" del file Excel test2019SDE.xlsx contiene le risposte % derivanti da un questionario riguardante la marca di pasta utilizzata da % un insieme di consumatori appartenenti a 5 regioni italiane. Un campione % casuale di 1200 individui ha risposto alla seguente domanda: quale tipo di % pasta utilizzi (PASTA)? Pasta di marca commerciale (A) Pasta di marca % industriale (B) La prima che mi capita è indifferente (C). % % Obiettivo: analizzare l'associazione tra il tipo di pasta utilizzato % prevalentemente e la regione di appartenenza. % % % Calcolare e interpretare gli indici Chi quadrato, Cramer e l'indice % tau di riduzione propozionale dell'eterogeneità. Interpretare gli % intervalli di confidenza degli indici di cui sopra. Creare e commentare il % grafico di analisi delle corrispondenze tra le variabili pasta e regione. % Inserire come titolo del grafico 'Cognome Nome Matricola' % % Commentare le caratteristiche dei punti colonna (output OverviewCols) % Commentare la proporzione degli intervistati della Lombardia. Individuare % la regione più distante dal profilo medio. Discutere la relazione tra la % colonna inerzia di ogni punto colonna e l'inerzia totale. Individuare il % punto colonna (punto dominante) che spiega meglio l'inerzia della prima % dimensione. Individuare i due punti colonna che spiegano meglio l'inerzia % della seconda dimensione. Discutere la quota di varianza dell'inerzia del % Piemonte e della Lomabrdia spiegata dalle prime due dimensioni. Collegare % la spiegazione alla posizione di queste due regioni nel grafico. % %% PARTE II % Fissare il seed dei numeri casuali a 100 % # Generare una matrice di numeri casuali Y di dimensione 300x3 dalla v.c. normale % con media 2 e varianza 10. % # Calcolare i boxplot per ogni colonna della matrice (commentare il risultato % ottenuto) % # Costruire la scatterplot matrix. Commentare i risultati. % # Calcolare la matrice dei coefficienti di cograduazione. Quali valori ci % attediamo? % # Rappresentare le 300 unità tramite facce e tramite stelle % # Calcolare le componenti principali sulle variabili standardizzate e determinare % la quota di varianza spiegata dalle prime due componenti. % %% PARTE III % % # Data una matrice quadrata A di dimensione n (n numero intero positivo a % piacere) generata con numeri provenienti dalla distribuzione uniforme, creare % una seconda matrice B avente la stessa dimensione di A, contenente una copia % degli elementi di A se questi sono maggiori del valore contenuto in una variabile % denominata x, oppure il numero 0.2 se questi sono minori o uguali al valore di % x % # Data la matrice A=magic(6). Calcolare una nuova matrice B che ha gli stessi % elementi di A al di sotto della diagonale principale e elementi uguali alla % media degli elementi di A sopra la diagonale principale. % # Generare una matrice di numeri casuali dalla distribuzione normale standardizzata di % dimensione 100x2. Calcolare la distanza Euclidea e la distanza di % Mahalanobis di ogni unità dal centroide. Calcolare e commentare il % coefficiente di correlazione tra i vettori delle due distanze. %