SQL est le langage universel pour interroger les bases de donnees. En Data Science, 80% du temps est consacre à la preparation des donnees stockees dans des bases SQL (PostgreSQL, MySQL, Snowflake, BigQuery).
Les pandas DataFrames en Python sont inspires de SQL. Comprendre SQL rend pandas plus intuitif et vous permet de travailler sur des volumes depassant la RAM.
SELECT, FROM, WHERE : requetes de baseCOUNT, SUM, AVG, MAX, MINGROUP BY pour regroupementsHAVING pour filtrer agregationsORDER BY pour trier les résultatsLIMIT pour limiter les résultatsINNER JOIN : ne garde que les lignes qui matchent dans les deux tables.
LEFT JOIN : garde toutes les lignes de la table de gauche, meme si pas de match à droite.
Comprendre les jointures est essentiel pour naviguer dans des bases de donnees normalisees.
Bases relationnelles : PostgreSQL, MySQL, SQL Server, SQLite.
Data Warehouses : Snowflake, Google BigQuery, Amazon Redshift.
BI Tools : Tableau, Power BI, Looker generent du SQL automatiquement.
Plus qu'un organisme de formation,
un mouvement
Ambassadeur gouvernemental, organisateur du 1er hackathon agents IA de France, partenaire des écoles et des institutions.