👋 Bienvenue sur mon Portfolio Data Science 👋
Bienvenue sur le repository de mon Portfolio de projets Data Science ! Ce repository contient mon Portfolio, une collection de mes différents projets de Data Science que j'ai réalisé, mettant en valeur mes compétences, techniques et expertise dans le domaine de la Data Science. J'espère que vous apprécierez le contenu ! 😀
Par Jessim Ahdjoudj ; https://www.linkedin.com/in/jessim-ahdjoudj-865b0126b/
Dans ce projet, on s'interesse aux chansons les plus écoutés (càd avec le plus de steams) sur la platforme Spotify en 2023. Pour ce faire, réalisons une Analyse Exploratoire de Données (EDA) complète afin de savoir quels artistes sont les plus écoutés et quelles sont les caractéristiques qu'une chanson doit avoir pour être beaucoup écoutée.
Pour une conclusion complète, voir le Pdf joint au repository du projet : Conclusion_EDA_Spotify.pdf.
- Nettoyer un jeu de données
- Décrire un jeu de données par statistique descriptive
- Identifier les variables d'intérêts
- Interpréter et donner un regard critique sur des données graphiques
- Analyser un jeu de données
- Partagez les découvertes et conclusion de l'analyse
- Permettre aux entreprises du secteur musical de prendre des décisions basées sur les données analysées
Dans ce projet, on cherche à développer un modèle de Machine Learning simple, un classificateur d'images capable de détecter des cartes à jouer. Pour ce faire, on développe un réseau neuronal convolutif (CNN) avec la librairie PyTorch qui est capable de prendre des images, puis de détecter quelle carte est dans cette image après traitement par le modèle (notre CNN).
- Machine Learning / Deep Learning
- Développer un modèle d'Intelligence Artificielle
- Classification automatique
- Développer un réseau neuronal convolutif (CNN)
- Analyser un jeu de données
- Evaluation des performances d'un modèle
Dans ce projet, on s'intéresse aux émotions et au feedback d'avis Amazon sur différents produits comestibles raffinés. Pour ce faire, on réalise une Analyse de Sentiments (Sentiment Analysis) dans laquelle on développe un algorithme de Machine Learning de Traitement du Langage Naturel (NLP) pour identifier les émotions derrière le texte des d'avis. Pour ce modèle, on utilisera 2 approches et donc 2 modèles :
- Modèle 1 : approche "bag of words" avec usage du VADER (Valence Aware Dictionary and sEntiment Reasoner) Sentiments Scoring (de C.J. Hutto et Eric Gilbert)
- Modèle 2 : approche "Transformer" avec usage du Roberta Pretrained Model (de Hugging Face)
- Machine Learning
- Développer un modèle d'Intelligence Artificielle
- Traitement du Langage Naturel / Natural Language Processing (NLP)
- VADER (Valence Aware Dictionary and sEntiment Reasoner) Sentiments Scoring / Bag of Words
- Roberta Pretrained Model / Transformer
- Analyser un jeu de données
- Evaluation des performances d'un modèle
Dans ce projet, on s'intéresse aux locations de vélos en libre-service par Santander Cycles (équivalent anglais de Velib'). Pour ce faire, on réalise réalise un Dashbord dynamique et user-friendly permettant de visualiser et d'analyser en temps réel le nombre de vélos loués ainsi que tous les paramètres rendrant en compte et influancant la location.
- Récupération et manipulation de données
- Analyser un jeu de données
- Développer un Dashbord sur Tableau