Filtra gli screencast

Big data

PySpark: partizionare i dati

Episodio 316 | Durata 19 minuti | Data 04-05-2023 | Categoria

I framework per Big Data, come Apache Spark, hanno la prerogativa di poter lavorare su cluster. In quest’ottica, la possibilità di partizionare i dati può essere davvero utile al fine di migliorare le prestazioni. Cerchiamo di capirne finalità ed impiego con PySpark

Data Science

Luigi: data pipeline in Python

Episodio 306 | Durata 21 minuti | Data 10-02-2023 | Categoria -

In un mondo sempre più connesso, i dati accumulati crescono e con loro la necessità di elaborarli. Le data pipeline sono processi articolati in più task in cui i dati passano per varie fasi e vengono trattati. Ecco una libreria Python fondamentale nel settore: Luigi di Spotify

Big data

BigQuery: strutture dati articolate

Episodio #293 | Durata 20 minuti | Data 27-10-2022 | Categoria

Con BigQuery associamo la complessità di Big Data con la semplicità di SQL. Possiamo costruire strutture dati articolate fondendo struct e array per poter rendere al meglio strutture di informazioni. Vediamo in questo screencast come esistano strumenti per poterle navigare ed esplorarne i valori.

Big data

BigQuery: array e struct

Episodio #278 | Durata 20 minuti | Data 29-06-2022 | Categoria - -

BigQuery permette di gestire la potenza dei Big Data con la semplicità del linguaggio SQL. Quest’ultimo per l’occasione è stato arricchito di caratteristiche come campi array e struct per una più completa definizione delle informazioni che permettono di gestire efficacemente ogni situazione.

Data Science

Google Data Studio: creare report

Episodio #276 | Durata 21 minuti | Data 15-06-2022 | Categoria -

Google Data Studio è uno strumento che offre data visualization di altissimo livello in maniera estremamente facile. Grazie a numerosi connector può essere sfruttato partendo da dataset disponibili su Cloud, database, Google Sheets e tantissime altre fonti. Creiamo insieme il nostro primo report!

Big data

BigQuery: il potente Data Warehouse di Google

Episodio #274 | Durata 20 minuti | Data 03-06-2022 | Categoria - -

BigQuery è lo strumento di analisi di Google che coniuga la complessità dei Big Data con la semplicità del linguaggio SQL. È integrato nella Google Cloud Platform e offre la possibilità di integrare in un unico Data Warehouse sorgenti dati diverse per creare un completo dataset.

Machine Learning

KNIME: analisi Big Data senza programmare

Episodio #252 | Durata 30 minuti | Data 09-12-2021 | Categoria -

Analizzare dati richiede spesso la capacità di programmare in almeno un linguaggio e ciò può risultare ostico a professionisti senza le giuste conoscenze. Con KNIME scopriamo una soluzione importantissima che permette di analizzare Big Data e applicare Machine Learning senza una riga di codice

Big data

Big Data su Cloud con Google Colab

Episodio #216 | Durata 26 minuti | Data 10-03-2021 | Categoria - -

Studiare Big Data è ormai alla portata di tutti con ciò che Apache Spark ed il mondo Python offrono, ma lo si può rendere ancora più comodo sfruttando Google Colab, completo ambiente in Cloud. Vediamo in questo screencast alcune sue caratteristiche utili in generale, ma focalizzandoci su Pyspark

Linguaggio R

R, introduzione al linguaggio per Data Science e Intelligenza Artificiale

Episodio #174 | Durata 25 minuti | Data 06-05-2020 | Categoria - - - -

Il linguaggio R è una risorsa storica dell’Informatica. Nato nei primi ’90 come piattaforma gratuita per la Statistica si è arricchito di funzionalità di ogni genere ed oggi la sua capacità di rapportarsi con Big Data e Machine Learning l’ha reso uno dei linguaggi in maggiore crescita al mondo

Machine Learning

Introduzione al Machine Learning

Episodio #141 | Durata 23 minuti | Data 04-09-2019 | Categoria - - -

Si parla molto di Machine Learning al giorno d’oggi. E’ una branca dell’Intelligenza Artificiale che esiste da molto tempo, ma che le condizioni tecnologiche di questo periodo hanno reso particolarmente attraente. E’ qualcosa di interessante e in grado offrire molti posti di lavoro