I DataFrame Pandas offrono tutto il necessario per poter ordinare le righe in base ai valori di una o più colonne. In questo screencast, vediamo tecniche per ordinare i DataFrame in base ad informazioni contenute all’interno di un campo, casistica che può spesso presentarsi
Pandas permette di trattare dati strutturati grazie ai suoi costrutti DataFrame e Series. Le funzionalità che mette a disposizione rendono possibili grandi risultati, ma per operazioni che sfuggono alle normali regole delle strutture è necessario saper impostare le proprie funzioni. Vediamo come
I fogli di calcolo sono una fonte importantissima per l’analisi dati, diffusi non solo in ambienti informatici o scientifici, ma in ogni ambito aziendale e amministrativo. Pandas domina la Data Science e qui la impieghiamo con fogli di calcolo ods, formato reso famoso da LibreOffice e OpenOffice
In un mondo sempre più connesso, i dati accumulati crescono e con loro la necessità di elaborarli. Le data pipeline sono processi articolati in più task in cui i dati passano per varie fasi e vengono trattati. Ecco una libreria Python fondamentale nel settore: Luigi di Spotify
Un elenco dei comuni italiani affidabile e aggiornato è una risorsa fondamentale per le nostre applicazioni ed ora scopriamo come ottenerlo. Inoltre, trattandosi di un file CSV piuttosto corposo sfrutteremo l’occasione per riflettere su come processare file di questo genere
NLTK dispone di moltissime funzionalità delle quali alcune mettono in campo capacità di analisi piuttosto evolute. In questo screencast parliamo della possibilità di analizzare automaticamente la struttura del testo scoprendo quale ruolo ha ogni singola parola all’interno della frase.
BigQuery permette di gestire la potenza dei Big Data con la semplicità del linguaggio SQL. Quest’ultimo per l’occasione è stato arricchito di caratteristiche come campi array e struct per una più completa definizione delle informazioni che permettono di gestire efficacemente ogni situazione.
Google Data Studio è uno strumento che offre data visualization di altissimo livello in maniera estremamente facile. Grazie a numerosi connector può essere sfruttato partendo da dataset disponibili su Cloud, database, Google Sheets e tantissime altre fonti. Creiamo insieme il nostro primo report!
BigQuery è lo strumento di analisi di Google che coniuga la complessità dei Big Data con la semplicità del linguaggio SQL. È integrato nella Google Cloud Platform e offre la possibilità di integrare in un unico Data Warehouse sorgenti dati diverse per creare un completo dataset.
Ogni linguaggio di programmazione offre funzioni statistiche spesso trascurate dal programmatore in quanto considerate “di nicchia”. Proponiamo qui – senza fare uso di codice – un caso comune dove concetti statistici possono tornare utili per creare nuove funzionalità nelle nostre applicazioni.