Corso Vittorio Emanuele II, 39 - Roma 0669207671

Ingénierie Informatique (Academic Year 2023/2024) - Big Data

Piattaforme per i Big Data


CFU: 9
Langue du contenu:Anglais
Description du cours

Quando si parla di Big Data, gli aspetti da considerare sono molteplici: ad esempio, quanto sono grandi i dataset, che tipo di analisi faremo, qual è il risultato atteso, ecc. In questo corso presenteremo una panoramica degli differenti aspetti collegati ai Big Data e descriveremo le piattaforme più diffuse in funzione della tipologia di problematiche affrontabili con ciascuna di esse.

Connaissances requises

Corso di Introduzione ai Big Data

Objectifs

Il corso ha lo scopo di fornire una conoscenza di base relativa alle diverse problematiche connesse alla gestione e l'analisi di Big Data, presentando le piattaforme più diffuse attualmente.

Programme

Il corso analizzerà diversi aspetti relativi alla gestione e analisi dei Big Data, con particolare riferimento ai seguenti aspetti:

- Batch computation vs Streaming

- Real Time Analysis

- Python Pandas

- Notebook Jupyter

- Tidy dataset: R, Pandas e Apache Arrow

- Big Graph Data Processing: Pregel e Giraph

- Apache Spark e Storm

- Cassandra

Textes

Slide del corso

Mining of Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman – Cambridge University Press

Big Data, Big Dupe – Stephen Few – Analytics Press

Entraînements

Utilizzo di alcune piattoforme di analisi dati mediante il linguaggio python e notebook Jupyter.

Professeur/Tuteur responsable enseignement
Luigi Laura
Liste des leçons
    •  Leçon n. 1: MAP-REDUCE  Go to this lesson
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone