Corso Vittorio Emanuele II, 39 - Roma 0669207671

الهندسة المعلوماتية (السنة الدراسية 2023/2024) - Big Data

Piattaforme per i Big Data


CFU: 9
لغة المحتوى:إنجليزي
وصف المادة

Quando si parla di Big Data, gli aspetti da considerare sono molteplici: ad esempio, quanto sono grandi i dataset, che tipo di analisi faremo, qual è il risultato atteso, ecc. In questo corso presenteremo una panoramica degli differenti aspetti collegati ai Big Data e descriveremo le piattaforme più diffuse in funzione della tipologia di problematiche affrontabili con ciascuna di esse.

المتطلبات المُسبقة

Corso di Introduzione ai Big Data

أهداف المادة

Il corso ha lo scopo di fornire una conoscenza di base relativa alle diverse problematiche connesse alla gestione e l'analisi di Big Data, presentando le piattaforme più diffuse attualmente.

البرنامج

Il corso analizzerà diversi aspetti relativi alla gestione e analisi dei Big Data, con particolare riferimento ai seguenti aspetti:

- Batch computation vs Streaming

- Real Time Analysis

- Python Pandas

- Notebook Jupyter

- Tidy dataset: R, Pandas e Apache Arrow

- Big Graph Data Processing: Pregel e Giraph

- Apache Spark e Storm

- Cassandra

نصوص

Slide del corso

Mining of Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman – Cambridge University Press

Big Data, Big Dupe – Stephen Few – Analytics Press

التمارين

Utilizzo di alcune piattoforme di analisi dati mediante il linguaggio python e notebook Jupyter.

مشرف / أستاذ المسؤول عن المادة
Luigi Laura
لائحة دروس الفيديو
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone
Marco Pirrone