Corso Big Data: analisi con DataFrame

8 ore
DURATA DEL CORSO
Certificazione
DISPONIBILE
TUTOR
HAI BISOGNO DI AIUTO?

Presentazione del corso

In questo Corso Big Data parliamo di SparkSQL, il modulo con cui il progetto Spark permette di lavorare in contesti Big Data utilizzando dati strutturati. Questo è un approccio assolutamente fondamentale perché permette di lavorare su grandi quantità di dati sfruttando le metodologie che ricordano molto da vicino i database relazionali e il lavoro sul database relazionale è un qualcosa che accomuna moltissimi informatici, perciò è un modo particolarmente intuitivo e amichevole per avvicinarsi al mondo dei Big Data e poter lavorare in maniera assolutamente produttiva (come richiesto oggigiorno dal mondo del lavoro). Potremo svolgere analisi ed elaborazioni sui dati e lo faremo sia con le API, per i DataFrame, la struttura dati principale di SparkSQL, sia con linguaggio SQL, proprio il linguaggio SQL che spesso si utilizza con i database relazionali e che tantissimi informatici conoscono è diventato uno degli strumenti principali per lavorare sui Big Data, proprio grazie a quello che ha fatto il progetto Spark con SparkSQL.

Requisiti: Big Data

Puoi seguire il corso da qualunque dispositivo: computer desktop, tablet o smartphone.

Vuoi un consiglio? Terminato il corso prova a ripeterlo, vedrai quante nozioni in più riuscirai ad apprendere semplicemente seguendo una seconda volta o più il corso.

Testi consigliati

Data Science con Python. La guida completa, dai Big Data al Machine Learning