Formazione
Il linguaggio Python per l’analisi dei dati – 26/11/2024
Ai partecipanti verrà presentato da zero il linguaggio Python finalizzando il suo utilizzo a tematiche di analisi e gestione dei dati. Si partirà dai problemi più comuni come l’import dei dati e la creazione di rappresentazioni grafiche, fino ad arrivare alla creazione di algoritmi di Machine Learning. Il tutto utilizzando alcune delle librerie più diffuse nel settore della Data Analysis come Pandas, Seaborn, Scikit-Learn e l’ambiente di sviluppo JupyterLab.
Programma:
Lezione 1 – Python e Pandas per l’acquisizione dei dati
– introduzione a Python e ai principali tipi di dato
– acquisire i dati con Pandas da file con formato csv, xlsx e json
– interagire con i Database e le chiamate API
– eseguire le prime analisi sui DataFrame con JupyterLab.
Lezione 2 – Pandas per l’analisi dei dati
– utilizzare i metodi query, groupby e merge per filtrare, raggruppare e combinare i dati
– conoscere metodi di trasformazione e pulizia dei dati più avanzati
– introduzione alle funzioni e alle istruzioni di controllo del flusso in problemi di analisi dei dati
– eseguire analisi statistiche con Pandas
Lezione 3 – Analisi esplorativa e rappresentazione dei dati
– creare le prime rappresentazioni grafiche con Pandas
– creare rappresentazioni grafiche più evolute con la libreria Seaborn
– conoscere le tipologie di grafico più idonee per ogni tipologia di analisi
– eseguire l’analisi esplorativa di un dataset
Lezione 4 – Introduzione al Machine Learning
– introduzione ai problemi di analisi dei dati affrontabili con il Machine Learning
– pre-processing dei dati con Scikit-Learn
– creazione di modelli di Machine Learning con Scikit-Learn
– valutare correttamente i risultati di un modello