Skip to content

Python Notebook Eseguibile per scaricare, pulire e analizzare un dataset preso da kaggle.

Notifications You must be signed in to change notification settings

JiacomoPassero/BDA_rotten-tomato-reviews-neo4j

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

Per scaricare il dataset sono necessaria chiavi Kaggle da integrare nel progetto.

Deve essere creato database neo4j e avviato prima dell'esecuzione della parte denominata "Creazione database Neo4j", le credenziali di base di accesso sono:

username: neo4j

password: pomodoro

ma possono essere cambiate a piacimento.

Durante l'esecuzione del notebook sarà necessario di aggiungere dei file generati alla directory import del progetto neo4j creato.

Due query di creazione pur essendo sintatticamente corrette vanno in errore se lanciate da driver in python, purtroppo non ho trovato la causa del problema e le stesse query lanciate da terminale cypher funzionano senza problemi quindi per la parte di popolamento del dataset, in particolare dei nodi Movie e dei link REVIEWS sarà necessario un ulteriore step manuale lanciando le query di creazione di nodi, link e indici da terminale.

Tutte le altre operazioni compreso quelle di download del dataset da kaggle sono svolte eseguendo il notebook il codice.

Il notebook contiene assieme al codice le riflessioni sul dataset e sui risultati ottenuti dalla data analysis.

About

Python Notebook Eseguibile per scaricare, pulire e analizzare un dataset preso da kaggle.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages