Science des données - Base de données sur l'incident du Titanic

Simon Zeru Image

Simon Zeru

Dernière modification : 10 juin 2025 (il y a 1 semaines)

📅 Période : Décembre 2024 – Janvier 2024

🛠️ Technologies : PostgreSQL

👩‍💻 Expertise : Science des données, Conception et gestion de bases de données

🎓 Compétences acquises : Gestion des données d'information, Conduite de projet, Travail en équipe

🔗 GitHub : Voir le dépôt

📄 Rapport : Voir le PDF

Cet article traite de la mise en œuvre de mon projet de science des données, où j'ai créé une base de données sur l'incident du Titanic et effectué des analyses dessus.

Couverture du projet

Aperçu du projet

Après avoir modélisé et implémenté une base alimentée par les informations mises à notre disposition sur l’incident du Titanic, nous avons réalisé des analyses pour obtenir des renseignements sur les passagers et l’équipage. Nos analyses incluaient l'exploration de divers aspects tels que les données démographiques des passagers, les taux de survie et les relations entre différentes variables.

Tout d'abord, nous avons réalisé l'ASE (Analyse Structurée des Entités) et la RLS (Représentation Logique Structurée) pour modéliser notre base de données :

Image du modèle de schéma de données

L'étape suivante consistait à coder la base de données en utilisant SQL. Nous avons créé le fichier create.sql pour définir la structure de la base de données et créer les tables nécessaires.

Image d'un extrait du fichier create.sql

L'analyse comprenait l'exploration de divers aspects tels que les données démographiques des passagers, les taux de survie et les relations entre différentes variables. Des requêtes SQL ont permis d’extraire des indicateurs clés, formalisés en statistiques descriptives.

Image d'un exemple de requête

Enfin, nous avons créé un rapport d'analyse pour visualiser les résultats obtenus à partir de nos requêtes et en tirer des conclusions.

Image d'une analyse graphique

Résultats du projet

Cette réalisation a permis d’acquérir les compétences de modélisation conceptuelle et logique de données, développement de requêtes SQL avancées et l’interprétation de résultats statistiques, offrant une première application concrète en science des données.