Il corso introduce i concetti di Data Science, Data Scientist e Big Data, con particolare attenzione alla presenza dei dati nella nostra vita e alla loro produzione. Saranno presentate le diverse tipologie di database e le varie tecniche di analisi. Saranno ripresi i concetti base della statistica e sarà dato ampio spazio all’ utilizzo di R, uno dei più diffusi software statistici open source, e il suo ambiente di sviluppo integrato (IDE) Rstudio. Saranno proposti esempi pratici di Machine Learning, Sentiment Analysis, data mining e Network Analysis.
Saranno evidenziati limiti e vantaggi dei big data. Durante tutto il corso particolare attenzione sarà posta verso le applicazioni in ambito clinico.