Skip to content

Projet ENSAE - Statistiques Bayésiennes - Antoine Grelety, Quentin Spalla, Zakarya Ali

Notifications You must be signed in to change notification settings

AntoineG92/bayesian_overlapping_clusters

 
 

Repository files navigation

A non parametric bayesian approach to modeling Overlapping Clusters

Article de référence: "A non parametric bayesian approach to modeling Overlapping Clusters"

Code : Zakarya Ali, Quentin Spalla, Antoine Grelety

Ce fichier contient:

  • Un notebook IOMM_algo_synthetic_data_K_finite_final.ipynb pour compiler le Mixture Model avec des données synthétiques
  • Un notebook OMM_movies_vf.ipynb pour compiler le Mixture Model avec la base de données des films
  • Une classe omm.py contenant les fonctions relatives à l’algorithme Mixture Model avec K fini
  • Un notebook IOMM_algo_synthetic_data_K_infinite_final.ipynb pour complier l’Infinite Mixture Model sur des données synthétiques
  • Une classe omm.py contenant les fonctions relatives à l’algorithme Infinite Mixture Model
  • Une classe utils.py contenant les fonctions qui permettent de générer des données synthétiques, d’initialiser la matrice theta et de formater les données de films
  • Un jeu de données contenant les catégories des films (matrice Z) clusters_matrix.csv
  • Un jeu de données contenant les données sur films (matrice X) binary_data_matrix.csv

Pour lancer l’algorithme et visualiser les résultats:

  • Sélectionner un des trois notebooks mentionnés ci-dessus
  • Entrer le nombre d’itération et les dimensions souhaitées (pour les données synthétiques)
  • Compiler le code

About

Projet ENSAE - Statistiques Bayésiennes - Antoine Grelety, Quentin Spalla, Zakarya Ali

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages

  • Jupyter Notebook 96.6%
  • Python 3.4%