Filtra gli screencast

Data Science

Pandas: ordinare dati in base a parti di un campo

Episodio 322 | Durata 22 minuti | Data 05-07-2023 | Categoria -

I DataFrame Pandas offrono tutto il necessario per poter ordinare le righe in base ai valori di una o più colonne. In questo screencast, vediamo tecniche per ordinare i DataFrame in base ad informazioni contenute all’interno di un campo, casistica che può spesso presentarsi

Data Science

Pandas: applicare proprie funzioni alle righe di un DataFrame

Episodio 311 | Durata 19 minuti | Data 31-03-2023 | Categoria -

Pandas permette di trattare dati strutturati grazie ai suoi costrutti DataFrame e Series. Le funzionalità che mette a disposizione rendono possibili grandi risultati, ma per operazioni che sfuggono alle normali regole delle strutture è necessario saper impostare le proprie funzioni. Vediamo come

Data Science

Pandas: analizzare dati dal formato ods

Episodio 308 | Durata 18 minuti | Data 09-03-2023 | Categoria

I fogli di calcolo sono una fonte importantissima per l’analisi dati, diffusi non solo in ambienti informatici o scientifici, ma in ogni ambito aziendale e amministrativo. Pandas domina la Data Science e qui la impieghiamo con fogli di calcolo ods, formato reso famoso da LibreOffice e OpenOffice

Data Science

Luigi: data pipeline in Python

Episodio 306 | Durata 21 minuti | Data 10-02-2023 | Categoria -

In un mondo sempre più connesso, i dati accumulati crescono e con loro la necessità di elaborarli. Le data pipeline sono processi articolati in più task in cui i dati passano per varie fasi e vengono trattati. Ecco una libreria Python fondamentale nel settore: Luigi di Spotify

Data Science

Elenco dei comuni italiani aggiornati: elaborazione con Pandas

Episodio 301 | Durata 17 minuti | Data 29-12-2022 | Categoria -

Un elenco dei comuni italiani affidabile e aggiornato è una risorsa fondamentale per le nostre applicazioni ed ora scopriamo come ottenerlo. Inoltre, trattandosi di un file CSV piuttosto corposo sfrutteremo l’occasione per riflettere su come processare file di questo genere

Machine Learning

NLTK: analizzare la struttura del testo

Episodio #280 | Durata 22 minuti | Data 14-07-2022 | Categoria - - - - -

NLTK dispone di moltissime funzionalità delle quali alcune mettono in campo capacità di analisi piuttosto evolute. In questo screencast parliamo della possibilità di analizzare automaticamente la struttura del testo scoprendo quale ruolo ha ogni singola parola all’interno della frase.

Big data

BigQuery: array e struct

Episodio #278 | Durata 20 minuti | Data 29-06-2022 | Categoria - -

BigQuery permette di gestire la potenza dei Big Data con la semplicità del linguaggio SQL. Quest’ultimo per l’occasione è stato arricchito di caratteristiche come campi array e struct per una più completa definizione delle informazioni che permettono di gestire efficacemente ogni situazione.

Data Science

Google Data Studio: creare report

Episodio #276 | Durata 21 minuti | Data 15-06-2022 | Categoria -

Google Data Studio è uno strumento che offre data visualization di altissimo livello in maniera estremamente facile. Grazie a numerosi connector può essere sfruttato partendo da dataset disponibili su Cloud, database, Google Sheets e tantissime altre fonti. Creiamo insieme il nostro primo report!

Big data

BigQuery: il potente Data Warehouse di Google

Episodio #274 | Durata 20 minuti | Data 03-06-2022 | Categoria - -

BigQuery è lo strumento di analisi di Google che coniuga la complessità dei Big Data con la semplicità del linguaggio SQL. È integrato nella Google Cloud Platform e offre la possibilità di integrare in un unico Data Warehouse sorgenti dati diverse per creare un completo dataset.

Data Science

Concetti di statistica per ogni programmatore

Episodio #269 | Durata 22 minuti | Data 27-04-2022 | Categoria -

Ogni linguaggio di programmazione offre funzioni statistiche spesso trascurate dal programmatore in quanto considerate “di nicchia”. Proponiamo qui – senza fare uso di codice – un caso comune dove concetti statistici possono tornare utili per creare nuove funzionalità nelle nostre applicazioni.