Video Tutorial Big Data

PySpark: partizionare i dati

Episodio 316 | Durata 19 minuti | Data 04-05-2023 | Categoria Big Data

I framework per Big Data, come Apache Spark, hanno la prerogativa di poter lavorare su cluster. In quest’ottica, la possibilità di partizionare i dati può essere davvero utile al fine di migliorare le prestazioni. Cerchiamo di capirne finalità ed impiego con PySpark

Luigi: data pipeline in Python

Episodio 306 | Durata 21 minuti | Data 10-02-2023 | Categoria Big Data - Data Science

In un mondo sempre più connesso, i dati accumulati crescono e con loro la necessità di elaborarli. Le data pipeline sono processi articolati in più task in cui i dati passano per varie fasi e vengono trattati. Ecco una libreria Python fondamentale nel settore: Luigi di Spotify

BigQuery: strutture dati articolate

Episodio #293 | Durata 20 minuti | Data 27-10-2022 | Categoria Big Data

Con BigQuery associamo la complessità di Big Data con la semplicità di SQL. Possiamo costruire strutture dati articolate fondendo struct e array per poter rendere al meglio strutture di informazioni. Vediamo in questo screencast come esistano strumenti per poterle navigare ed esplorarne i valori.

BigQuery: array e struct

Episodio #278 | Durata 20 minuti | Data 29-06-2022 | Categoria Big Data - Data Science - Machine Learning

BigQuery permette di gestire la potenza dei Big Data con la semplicità del linguaggio SQL. Quest’ultimo per l’occasione è stato arricchito di caratteristiche come campi array e struct per una più completa definizione delle informazioni che permettono di gestire efficacemente ogni situazione.

Google Data Studio: creare report

Episodio #276 | Durata 21 minuti | Data 15-06-2022 | Categoria Big Data - Data Science

Google Data Studio è uno strumento che offre data visualization di altissimo livello in maniera estremamente facile. Grazie a numerosi connector può essere sfruttato partendo da dataset disponibili su Cloud, database, Google Sheets e tantissime altre fonti. Creiamo insieme il nostro primo report!

BigQuery: il potente Data Warehouse di Google

Episodio #274 | Durata 20 minuti | Data 03-06-2022 | Categoria Big Data - Data Science - Machine Learning

BigQuery è lo strumento di analisi di Google che coniuga la complessità dei Big Data con la semplicità del linguaggio SQL. È integrato nella Google Cloud Platform e offre la possibilità di integrare in un unico Data Warehouse sorgenti dati diverse per creare un completo dataset.

KNIME: analisi Big Data senza programmare

Episodio #252 | Durata 30 minuti | Data 09-12-2021 | Categoria Big Data - Machine Learning

Analizzare dati richiede spesso la capacità di programmare in almeno un linguaggio e ciò può risultare ostico a professionisti senza le giuste conoscenze. Con KNIME scopriamo una soluzione importantissima che permette di analizzare Big Data e applicare Machine Learning senza una riga di codice

Big Data su Cloud con Google Colab

Episodio #216 | Durata 26 minuti | Data 10-03-2021 | Categoria Big Data - Cloud - Python

Studiare Big Data è ormai alla portata di tutti con ciò che Apache Spark ed il mondo Python offrono, ma lo si può rendere ancora più comodo sfruttando Google Colab, completo ambiente in Cloud. Vediamo in questo screencast alcune sue caratteristiche utili in generale, ma focalizzandoci su Pyspark

R, introduzione al linguaggio per Data Science e Intelligenza Artificiale

Episodio #174 | Durata 25 minuti | Data 06-05-2020 | Categoria Big Data - Data Science - Intelligenza Artificiale - Machine Learning - R

Il linguaggio R è una risorsa storica dell’Informatica. Nato nei primi ’90 come piattaforma gratuita per la Statistica si è arricchito di funzionalità di ogni genere ed oggi la sua capacità di rapportarsi con Big Data e Machine Learning l’ha reso uno dei linguaggi in maggiore crescita al mondo

Introduzione al Machine Learning

Episodio #141 | Durata 23 minuti | Data 04-09-2019 | Categoria Big Data - Intelligenza Artificiale - Machine Learning - Python

Si parla molto di Machine Learning al giorno d’oggi. E’ una branca dell’Intelligenza Artificiale che esiste da molto tempo, ma che le condizioni tecnologiche di questo periodo hanno reso particolarmente attraente. E’ qualcosa di interessante e in grado offrire molti posti di lavoro

Screencasts Big Data

Filtra gli screencast