logit model statistica multivariata 2019/2020 MINI VALENTINA ######################## getwd() #change directory --> passito pass=read.csv2("passito.csv",header=T) attach(pass) str(pass) summary(pass) # per vedere i valori tendenziali delle variabili #1.creaiamo la variabile dicotomica LIKE_PASSITO # interveniamo sul dataset: se 7 o 6 --> 0 (referenza) se 0;5 --> 1 (non mi piace) #2. creiamo la variabile dicotomica SEX: 0 femmine; 1 mashio #3. creiamo anche la variabile dicotomica LIKE_WINE #4. creiamo la variabile politomica AGE_RANK: da 17 e 19: 0 (giovanissimi) da 20 a 25: 1 (molto giovani) da 26 a 36: 2 (giovani) da 37 a 47: 3 adulti da 48 a 58: 4 maturi da 59 a 69: 5 pensione da 70 a 79: 6 anziani # PRIMA DOMANDA DI RICERCA: la possibilità di amare il passito è legata al genere? xtabs(~LIKE_PAS+SEX,data=pass) # tavola di contingenza # modello : #P(Y)=exp(b0+b1x1)/eexp(b0+b1x1)+1 --> la probabilità di Y di essere "vera" basata su alcuni parametri #risposta: si, la probabilità di amare il passito è legata al genere: infatti gli uomini hanno meno probabilità di amare il passito (-0.7402) # il modello non è buono (differenza tra null deviance eresidual deviance molto bassa) # ma il genere può essere una variabile di "contesto" # aggiungiamo alcuni predittori e consideriamo il genere come variabile di controllo RISPONDETE ALLE SEGUENTI DOMANDE DI RICERCA # seconda domanda di ricerca: # la possibilità di amare il passito è legata all'età? # terza domanda di ricerca: # la possibilità di amare il passito è legata alla preferenza per il vino in genere?