% 16 scrittori di romanzi sono stati valutati da un campione di lettori che % hanno espresso opinioni sul tipo di contenuto e sul modo in cui sono state % scritte le loro opere in base alle seguenti variabili % X1: giudizio complessivo, % X2: leggibilità, % X3: politica, % X4: fantasia, % X5: desiderio di rilettura, % X6: attualità. % % Importare i dati delle 6 variabili dal file di Excel denominato % scrittori.xlsx utilizzando la funzione readtable % % QUESITI % 1) Rappresentare i dati in termini di icone (o facce) % in modo da individuare eventuali scrittori anomali. % 2) Calcolare la matrice di correlazione. Commentare il coefficiente di % correlazione lineare tra le variabili X5 e X2. Costruire e commentare il % diagramma di dispersione tra le variabili X5 (in asse delle ordinate) e % X2 (in asse delle ascisse) e commentare la relazione. Illustrare se in % questo diagramma di dispersione c'è qualche valore anomalo bivariato. % 3) Effettuare una riduzione delle dimensioni (operare sulle variabili in % forma standardizzata) % 4) Scegliere un numero di CP appropriato % 5) Calcolare e commentare le correlazioni tra CP e le variabili % originarie. Calcolare e interpretare le comunalità. % 6) Interpretare le CP estratte. Che caratteristiche hanno gli scrittori % che presentano valori elevati della prima CP? Che caratteristiche hanno % gli scrittori che presentano valori elevati della seconda CP? % Costruire il biplot inserendo come punti riga le componenti principali % standardizzate Z*V*\Lambda^-0.5 e come punti colonna (frecce) le correlazioni. % 7) Costruire il biplot tramite la svd utilizzando omega=1 e alpha =0, % ossia punti riga come \sqrt(n-1)*U (componenti principali standardizzate) % e punti riga come Gamma*V (correlazioni). Veficare che i punti riga e % colonna calcolati nei due metodi 6) e 7) coincidono % % I quesiti che seguono possono essere risolti solo dopo aver svolto la % cluster analysis % % % 8) Applicare ai dati standardizzati la cluster analysis basata sul metodo % delle k-medie utilizzando 3 gruppi. % 9) Calcolare i centroidi dei 3 gruppi in termini di variabili % originarie e di variabili in forma standardizzata. Proiettare i % centroidi nello spazio delle prime due componenti principali. % Aggiungere al biplot precedente i 3 centroidi. Interpretare % i 3 gruppi che sono stati trovati. % 10) Calcolare la distanza Euclidea e la distanza di Mahalanobis di ogni % scrittore dal centroide. Calcolare e commentare il coefficiente di % correlazione tra le due graduatorie.