Le tesi di tipo sperimentale ormai vengono richieste da molti relatori ai propri studenti in svariate facoltà, in quanto prevedono sempre una parte più applicativa dei concetti studiati nel proprio percorso di studi.
Un problema che spesso i laureandi si trovano ad affrontare è l’analisi statistica di un set di dati da dover realizzare in quanto spesso hanno poche o, addirittura, nessuna conoscenza della materia e quindi si trovano in difficoltà con la stesura di questa parte.
Per capire come affrontare in modo semplice questo tipo di analisi vediamo insieme quali sono i passaggi fondamentali.
Individuare l’argomento dei dati da analizzare
Ogni tesi ha un argomento principale che viene trattato e discusso, il quale però può avere diverse sfaccettature: la cosa principale a cui bisogna pensare è a quale aspetto dare maggiore importanza così da riuscire a metterlo in evidenza.
Una volta capito cosa ci interessa maggiormente (magari anche su consiglio del proprio relatore) comincia la parte pratica, ovvero analizzare dei dati sull’argomento scelto. Sì, ma quali dati?
Scopriamolo insieme nel prossimo paragrafo.
Come raccogliere i dati per la tesi sperimentale
Il reperimento dei dati è una delle fasi più importanti per la realizzazione dell’analisi statistica. Ci sono principalmente due modi in cui possiamo ottenere il nostro dataset:
- Possiamo cercare su internet dei dati relativi al nostro argomento. Molti siti, come l’Istat o Kaggle, permettono di scaricare i file in formato csv o excel, per poi essere importati ed elaborati nel software che decideremo di usare (ne parleremo alla fine). Purtroppo, però, si potrebbero non trovare dati o variabili di nostro reale interesse.
- Se l’argomento trattato lo consentisse, si potrebbe pensare di costruire da zero un questionario e somministrarlo utilizzando ad esempio Google Moduli (come creare un questionario online per la tesi?). Attenzione: la parte di stesura delle domande del questionario è fondamentale in quanto bisogna sapere cosa chiedere nello specifico e come porre le domande altrimenti rischiamo di non poter effettuare le analisi di cui abbiamo effettivamente bisogno.
Se ti serve aiuto per la costruzione del questionario contattaci, forniamo consulenze ad hoc anche per chi non sa da dove iniziare con la sua analisi per la tesi!
Numerosità minima del campione per tesi di laurea
Quando si conducono delle analisi statistiche per le tesi, si rischia sempre di non avere un campione molto numeroso: se il questionario è stato creato e somministrato da voi, l’idea è di farlo circolare il più possibile (ad esempio sui gruppi Facebook e Instagram, ma anche tra i propri amici e conoscenti). Una volta che ho un numero sufficiente di rispondenti (diciamo almeno un centinaio) possiamo iniziare a mettere le mani sui dati veri e propri.
E se ho pochi dati o poco tempo per raccoglierli? Esistono tecniche statistiche che permettono di lavorare anche con un numero risotto di dati, dipende sempre da quale è l’obiettivo primario.
Sistemazione e pulizia dei dati raccolti tramite questionario
Una volta che abbiamo il nostro bel dataset siamo subito pronti per iniziare a fare le prime analisi? Non sempre! Non avere fretta di iniziare senza nemmeno vedere cosa hai davanti.
Le prime cose che bisogna fare, anche se spesso noiose, sono la sistemazione e la pulizia del dataset: la maggior parte del tempo è dedicata a questo rispetto alle analisi vere e proprie, infatti quando siamo sicuri che tutto sia pronto e che i dati non presentino incongruenze o errori, allora possiamo iniziare a fare analisi statistiche.
Cosa si intende con sistemazione e pulizia dei dati?
È possibile avere risposte duplicate, oppure qualcuno che ha risposto solo a certe domande lasciando il questionario incompleto o, ancora, avere risposte aperte che vanno ricodificate e molto altro ancora.
Inoltre, la maggior parte dei software statistici richiedono che per ognuna delle domande somministrate venga specificata la natura della variabile (scala, ordinale, nominale, ecc.).
Se stai hai problemi nella sistemazione e preparazione dei dati raccolti per la tua tesi di laurea non esitare a contattarci senza impegno!
Prima analisi descrittiva dei dati per la tua tesi di laurea
Una delle prime analisi statistiche che si effettuano sono le statistiche descrittive univariate delle variabili a disposizione, per capire quali siano le caratteristiche del nostro campione raccolto.
Per le variabili quantitative (come l’età, l’altezza, ecc.) generalmente si riportano gli indici di centralità e variabilità come ad esempio moda, media, mediana e gli indici di variabilità come varianza, deviazione standard e coefficiente di variazione.
Per le variabili qualitative, ovvero non numeriche, solitamente si riportano le tabelle di frequenze assolute e percentuali (es: Maschi= 40 (58,8%); Femmine=28 (41,2%)).
Possiamo pensare di affiancare all’analisi descrittiva anche dei grafici, come barplot (o grafici a barre), istogrammi, grafici a torta per visualizzare le informazioni ottenute (quali grafici scegliere per svolgere le proprie analisi?).
Analisi più avanzate per la tesi: correlazioni, test, regressione
n base alle ipotesi che abbiamo formulato possiamo andare a fare delle analisi un pochino più avanzate: per esempio, se vogliamo vedere la relazione tra due variabili categoriche possiamo realizzare un chi-quadrato; se vogliamo analizzare la media di una variabile tra due gruppi possiamo utilizzare un t-test; possiamo prevedere una variabile numerica attraverso una regressione lineare semplice o multipla oppure possiamo prevedere una variabile categorica con due sole modalità tramite una regressione logista o, ancora, possiamo ridurre il numero di variabili con un’analisi fattoriale.
Modelli più complessi sono, ad esempio, quelli di mediazione, moderazione, modelli SEM e tanto altro.
Per le analisi statistiche nelle tesi di medicina (ma non solo) potremmo fare delle analisi di sopravvivenza, come le curve di Kaplan Meier, delle curve ROC e molto ancora.
Come avrai capito, esistono moltissime analisi che puoi fare per la tua tesi, devi solo capire cosa ti interessa sapere maggiormente a partire dalle tue ipotesi.
Se sei insicuro su come procedere o su quali siano le analisi più adatte per la tua tesi di laurea, puoi contattarci per una consulenza privata!
Software da usare per le analisi statistiche della tesi: Excel, R, SPSS, Stata
Siamo arrivati alla fine: sappiamo quali analisi statistiche vogliamo inserire nella tesi, ma come facciamo a realizzarle concretamente?
È possibile utilizzare molti software, come Excel che permette di fare le descrittive più semplici (come media, mediana, …) e qualche test, come il t-test (per poterlo eseguire hai bisogno dello strumento “Analisi dei dati”, accessibile da “Dati”):
In alternativa possiamo utilizzare dei software statistici appositi come SPSS, R e Stata.
R/Rstudio è un linguaggio di programmazione con moltissime funzioni all’interno ed è open source, tuttavia per chi non ha dimestichezza e poco tempo per fare le analisi, può diventare complicato usarlo.
SPSS è un software a pagamento, di cui però esiste la prova gratutita di un mese, molto comodo, soprattutto per chi non ha esperienza, in quanto si può lavorare attraverso un menù a tendina.
Se ti interessa imparare l’utilizzo di questo software abbiamo anche un corso SPSS base e un corso SPSS avanzato.
Se sei interessato ad imparare ad utilizzarlo, allora fa per te il nostro corso R base! Se invece hai conoscenze preliminari ma vuoi approfondire ulteriormente questo strumento, ti proponiamo il corso R avanzato.
Infine, Stata è un sofware, sempre a pagamento, che permette sia di usare un linguaggio di programmazione che il menù a tendina, quindi una via di mezzo tra gli altri due. Puoi chiederci una consulenza cliccando qui.
Quale è il più adatto? In generale posso usare uno qualunque di questi software, anche se spesso è il professore a farne usare uno in particolare (e spesso l’Università offre licenze gratutite per gli studenti).
Ancora sei indeciso o dubbioso su come procedere? Vorresti dei professionisti che ti aiutino passo passo con le tue analisi o preferisci che vengano svolte per te su consegna? Non esitare a contattarci, offriamo sia corsi che consulenze che analisi su consegna!
Articolo a cura della Dott.ssa Alessandra Cardinale