Corso Vittorio Emanuele II, 39 - Roma 0669207671

Ingegneria Informatica (Anno Accademico 2023/2024) - Big Data

Piattaforme per i Big Data


CFU: 9
Lingua contenuti:Italiano
Descrizione dell'insegnamento
Quando si parla di Big Data, gli aspetti da considerare sono molteplici: ad esempio, quanto sono grandi i dataset, che tipo di analisi faremo, qual è il risultato atteso, ecc. In questo corso presenteremo una panoramica degli differenti aspetti collegati ai Big Data e descriveremo le piattaforme più diffuse in funzione della tipologia di problematiche affrontabili con ciascuna di esse.
Prerequisiti
Corso di Introduzione ai Big Data
Scopi
Il corso ha lo scopo di fornire una conoscenza di base relativa alle diverse problematiche connesse alla gestione e l'analisi di Big Data, presentando le piattaforme più diffuse attualmente.
Contenuti

Il corso analizzerà diversi aspetti relativi alla gestione e analisi dei Big Data, con particolare riferimento ai seguenti aspetti:

- Batch computation vs Streaming

- Real Time Analysis

- Python Pandas

- Notebook Jupyter

- Tidy dataset: R, Pandas e Apache Arrow

- Big Graph Data Processing: Pregel e Giraph

- Apache Spark e Storm

- Cassandra

Testi

Slide del corso

Mining of Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman – Cambridge University Press

Big Data, Big Dupe – Stephen Few – Analytics Press

Esercitazioni
Utilizzo di alcune piattoforme di analisi dati mediante il linguaggio python e notebook Jupyter.
Docente/Tutor Responsabile insegnamento
Luigi Laura
Docenti video
Prof. Luigi Laura - Università Telematica Internazionale UNINETTUNO (Roma - Italy)
Prof. Marco Pirrone - CKH Innovations Opportunities Development (Londra)
Elenco delle lezioni
    •  Lezione n. 1: MAP-REDUCE  Vai alla lezione
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone